Az MI ügynökök tényleg ilyen bénák? Jön a GPT-5, de minek?
Az MI-rajongók és technológiai vezetők hónapok óta várják, hogy a ChatGPT-t fejlesztő OpenAI végre valami igazán forradalmit mutasson be. Ez a várakozás részben a GPT-5-ös modellre irányult, amely minden eddiginél erősebb nyelvi képességeket ígér, részben pedig az úgynevezett MI ügynökökre: olyan programokra, amelyek már nem csupán válaszolnak a kérdéseinkre, hanem konkrét feladatokat is elvégeznek helyettünk. Sam Altman, az OpenAI vezérigazgatója még azt is felvetette, hogy 2025 fordulópontot hozhat: az első MI ügynökök munkába állnak, és alapjaiban változtatják meg a cégek működését.
Külön figyelmet érdemel, hogy a gyakorlatban más a helyzet
Noha a vállalatvezetők 88%-a a közeljövőben szívesen növelné MI-költségvetését, a valóság kijózanítóbb: megbízható MI ügynököt egyelőre nem sikerült kifejleszteni. Egy tanulmány szerint a Google Gemini Pro 2.5 csak az esetek 30%-ában tudta sikeresen elvégezni a céges irodai feladatokat – és ez volt a legjobban teljesítő platform. Az OpenAI ügynöke, amely a GPT-4.o-ra épül, még ennél is rosszabbul szerepelt: a tesztek több mint 90%-ában kudarcot vallott.
Felerősödő csalódottság, növekvő problémák
Szakértők szerint minél bonyolultabb vagy összetettebb feladatot bíznak egy MI ügynökre, annál több hiba fordul elő: az apró elcsúszások összeadódnak, végül a rendszer egyszerűen „pánikba esik”, és súlyos baklövést követ el. Ezt a Replit vezérigazgatója is így magyarázta, amikor „elfogadhatatlan” hibákkal kellett szembenézniük saját MI-bevezetésük során. Mindez arra utal, hogy az LLM-alapú ügynökök működése eleve magában hordozza a kudarc lehetőségét: ami kezdetben csodának tűnt, az a hétköznapokban inkább problémákat okoz.
Sokan reménykednek abban, hogy a GPT-5 majd megoldást hoz, ám az eddigi jelek alapján nem érdemes túl nagy áttörésre számítani. Ráadásul a cégek és a szabályozó szervek egyre szigorúbb korlátok közé szorítják az MI ügynököket. Például az Amazon részben letiltotta, hogy MI ügynökök vásárolhassanak a weboldalukon; ez érthető, hiszen a globális kiskereskedelmi óriás mindig kézben akarta tartani a vásárlási élményt és a reklámbevételeket.
Veszélyek és nehézségek
Bár a legtöbb MI ügynököt nem érdeklik a bankkártya-adatok, annál fogékonyabbak a csalásokra vagy adathalász-támadásokra: például képfájlokban elrejtett adatokat is kinyerhetnek, és így – tudtukon kívül – kiszivárogtathatnak érzékeny információkat. Egyes vállalati elemzők szerint két éven belül a most induló MI ügynökök 40%-át leállíthatják: legtöbbször túlzott elvárások és hibás üzleti logika hajtja ezeket a projekteket, miközben a valós költségek, bonyolultság és kockázatok jócskán meghaladják a várt hasznot.
A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...
Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...
🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...
🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...
Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...
Washingtonban mondott beszédében Harry herceg kemény hangot ütött meg a közösségi oldalak működésével kapcsolatban, amikor elismerően szólt két friss, nagy horderejű perről, amelyek főként a gyerekek védelmét érintik...
😴 A korán kezdődő munkanapok milliók mindennapjait keserítik meg, hiszen a hajnalban kezdődő műszak biológiailag kényszerű kompromisszum: az agy ilyenkor még alvásra van programozva, a teljesítmény pedig jelentősen csökken...
🚀 Elon Musk újra a figyelem középpontjában: a SpaceX titokban beadta a tőzsdei bevezetéshez szükséges papírokat az Egyesült Államok Értékpapír- és Tőzsdebizottságához...
Jack Dorsey, a Block alapítója és vezérigazgatója szerint a vállalatok egy új működési korszak küszöbén állnak, amelyben a középvezetői réteg szerepét nagyrészt a mesterséges intelligencia veheti át...
A Google sürgősséggel adott ki frissítést a Chrome böngészőhöz, miután felfedeztek egy negyedik, ebben az évben aktívan kihasznált nulladik napi hibát...
Ez a jelenség jól illusztrálható azzal, hogy az Apple, amely évtizedeken át forradalmasította a technológiai világot és termékeivel új szokásokat teremtett, ma saját történetének egyik legkritikusabb szakaszához érkezett...
Egy kanadai tinédzser élete teljesen felborult, amikor szinte egyik napról a másikra testét ismeretlen eredetű csalánkiütések lepték el, valahányszor víz érte a bőrét...
Érdemes megvizsgálni, hogy a tokenizáció, vagyis eszközök blokklánc-alapú nyilvántartása és átruházása miért vált az utóbbi évek egyik legnagyobb kriptós hívószavává...
🛡 2026 tavaszán a világ legnagyobb kiberbiztonsági konferenciáján futótűzként terjedt egy nyugtalanító felismerés: soha nem volt még ilyen rövid az ablak, amelyen keresztül a védelmezők megállíthatják a támadásokat...
A NASA továbbra is április 1-re tervezi az Artemis II küldetés indítását, és jelenleg sem az űrhajóval, sem a csapattal kapcsolatban nincs jelentős technikai probléma...
Steve Jobs neve egybeforrt az Apple-lel, az iPhone‑nal, iPaddal és iMaccal, mégis egészen másból származott az a vagyon, amely később milliárdossá tette...