Az MI ügynökök tényleg ilyen bénák? Jön a GPT-5, de minek?
Az MI-rajongók és technológiai vezetők hónapok óta várják, hogy a ChatGPT-t fejlesztő OpenAI végre valami igazán forradalmit mutasson be. Ez a várakozás részben a GPT-5-ös modellre irányult, amely minden eddiginél erősebb nyelvi képességeket ígér, részben pedig az úgynevezett MI ügynökökre: olyan programokra, amelyek már nem csupán válaszolnak a kérdéseinkre, hanem konkrét feladatokat is elvégeznek helyettünk. Sam Altman, az OpenAI vezérigazgatója még azt is felvetette, hogy 2025 fordulópontot hozhat: az első MI ügynökök munkába állnak, és alapjaiban változtatják meg a cégek működését.
Külön figyelmet érdemel, hogy a gyakorlatban más a helyzet
Noha a vállalatvezetők 88%-a a közeljövőben szívesen növelné MI-költségvetését, a valóság kijózanítóbb: megbízható MI ügynököt egyelőre nem sikerült kifejleszteni. Egy tanulmány szerint a Google Gemini Pro 2.5 csak az esetek 30%-ában tudta sikeresen elvégezni a céges irodai feladatokat – és ez volt a legjobban teljesítő platform. Az OpenAI ügynöke, amely a GPT-4.o-ra épül, még ennél is rosszabbul szerepelt: a tesztek több mint 90%-ában kudarcot vallott.
Felerősödő csalódottság, növekvő problémák
Szakértők szerint minél bonyolultabb vagy összetettebb feladatot bíznak egy MI ügynökre, annál több hiba fordul elő: az apró elcsúszások összeadódnak, végül a rendszer egyszerűen „pánikba esik”, és súlyos baklövést követ el. Ezt a Replit vezérigazgatója is így magyarázta, amikor „elfogadhatatlan” hibákkal kellett szembenézniük saját MI-bevezetésük során. Mindez arra utal, hogy az LLM-alapú ügynökök működése eleve magában hordozza a kudarc lehetőségét: ami kezdetben csodának tűnt, az a hétköznapokban inkább problémákat okoz.
Sokan reménykednek abban, hogy a GPT-5 majd megoldást hoz, ám az eddigi jelek alapján nem érdemes túl nagy áttörésre számítani. Ráadásul a cégek és a szabályozó szervek egyre szigorúbb korlátok közé szorítják az MI ügynököket. Például az Amazon részben letiltotta, hogy MI ügynökök vásárolhassanak a weboldalukon; ez érthető, hiszen a globális kiskereskedelmi óriás mindig kézben akarta tartani a vásárlási élményt és a reklámbevételeket.
Veszélyek és nehézségek
Bár a legtöbb MI ügynököt nem érdeklik a bankkártya-adatok, annál fogékonyabbak a csalásokra vagy adathalász-támadásokra: például képfájlokban elrejtett adatokat is kinyerhetnek, és így – tudtukon kívül – kiszivárogtathatnak érzékeny információkat. Egyes vállalati elemzők szerint két éven belül a most induló MI ügynökök 40%-át leállíthatják: legtöbbször túlzott elvárások és hibás üzleti logika hajtja ezeket a projekteket, miközben a valós költségek, bonyolultság és kockázatok jócskán meghaladják a várt hasznot.
Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...
Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...
Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...
❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...
Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...
💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...
🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...
A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...
⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...
Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...
🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...
A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...
⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...
🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..
A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...
💸 A világ egyik legnagyobb motor- és elektronikai alkatrészgyártójaként ismert, több mint 100 ezer embert foglalkoztató japán Nidec Corporation most hatalmas nyomás alatt áll: a Blackfield zsarolóvírus-banda 2 millió dollárt, vagyis körülbelül 726 millió forintot követel tőle...
🚦 Érdemes megvizsgálni, hogy a Shetland-szigetek vezetése radikális változtatásra készül a közlekedésben: egy 1,5 milliárd angol font (650 milliárd forint) értékű terv szerint az elöregedő kompokat víz alatti alagutak válthatják fel a következő nyolc éven belül...
A 19. század csatornaépítési és vasúti láza, a dotkom-lufi 2000-ből – mind gazdaságtörténeti példák arra, hogy valódi technológiai áttörések túlfűtött beruházási hullámokat indíthatnak el, amelyek végül recesszióval végződhetnek...
Az IBM újabb mérföldkőhöz érkezett a chiptechnológia világában: bemutatta a világ első, 1 nanométernél kisebb csíkszélességű technológiáját, mellyel egy körömnyi lapkán közel 100 milliárd tranzisztor kap helyet...