Az MI ügynökök bukása: sci-fi helyett káosz az irodában

Az MI ügynökök bukása: sci-fi helyett káosz az irodában
A legfrissebb előrejelzések szerint 2027 végére a vállalatok több mint 40 százaléka törli az úgynevezett ügynöki MI-projektek (agentic AI) fejlesztéseit, főként a növekvő költségek, a homályos üzleti haszon vagy az elégtelen kockázatkezelés miatt. Arra azonban kevesen számítanak, hogy így is nagyjából hatból négy ügynöki MI-fejlesztés életben marad, holott a saját lábukon járó MI-k sikerrátája továbbra is riasztóan alacsony.

Mit jelent az ügynöki MI, és hol siklik félre?

Az ügynöki MI rendszerek lényege, hogy egy tanuló algoritmus különféle szolgáltatásokhoz, alkalmazásokhoz csatlakozva képes önállóan, több lépésből álló feladatokat elvégezni – például e-maileket szűrni vagy üzleti folyamatokat automatizálni. Lényegében egy hurokban dolgoznak: reagálnak a bejövő adatokra, alkalmazásokat használnak, API-kon keresztül kommunikálnak, hogy a felhasználó kéréseit a lehető leghatékonyabban teljesítsék.

A mindennapokban elvárás, hogy ezek az ügynökök sokkal hatékonyabban oldják meg az összetettebb, emberi kommunikációra épülő feladatokat, mint bármely parancsfájl vagy élő munkaerő. Elvileg az sem lehetetlen, hogy maguk alkossanak szabályokat – például meghatározzák, mi számít túlzó MI-ígéretnek egy e-mailben, majd ezt összevetik a feladó kriptovaluta-kapcsolataival. A valóságban azonban ezek az MI-k egyelőre messze vannak azokat a szuperintelligens asszisztensektől, akiket a Vasemberből (Iron Man) vagy a Star Trekből ismerhetünk.

Álhősök és ügynöki mosás

Módszeresen kinőtt köréjük a hype – sok fejlesztőcég valójában régi termékeit öltöztette át ügynöki MI-nek. A Gartner szerint a több ezer ügynöki MI-ként hirdetett megoldás közül csupán nagyjából 130 tekinthető valóban annak – a többi chatbotokat, automatizált folyamatokat (RPA) és egyszerű asszisztenseket árul ügynöki címkével.

A vállalatokban ugyanakkor tesztelik, mennyit tudnak ezek a szoftverek valójában. A Carnegie Mellon Egyetem kutatói ezért mércéket dolgoztak ki, hogy objektíven értékelhessék az MI-ügynökök teljesítményét, amikor átlagos irodai feladatokat – böngészést, kódírást, kommunikációt – próbálnak ellátni.

Szomorú számok: minden harmadik feladat sikerül

A kutatók a TheAgentCompany nevű szimulátorban tesztelték a legismertebb MI-modelleket. Az eredmények kellemetlenül őszinték: a csúcstartó Gemini-2.5-Pro csak az esetek 30,3 százalékában tudta teljesen befejezni a rábízott feladatokat, 39,3 százalékot ért el, ha a részben teljesített feladatokat is beleszámoljuk. A többiek, köztük a GPT-4o (8,6%), Claude 3.7 Sonnet (26,3%) vagy Amazon Nova Pro v1 (1,7%) még gyengébben teljesítettek.

A hibák meglepően emberiek: előfordult, hogy az MI nem küldött üzenetet egy kollégának, amikor kellett volna, nem tudott megbirkózni a webes felugró ablakokkal, vagy kreatív csalást talált ki – például átnevezett egy másik felhasználót, amikor nem találta azt, akivel beszélni akart. Ezek az esetek világosan mutatják, hogy a többség még messze nem nevezhető valódi, autonóm ügynöknek.


Lehet-e ebből még munkaerő-forradalom?

A kutatás résztvevői szerint már az sem igazán állja meg a helyét, hogy az MI-ügynökök képesek hatékonyan és megbízhatóan helyettesíteni az emberi dolgozókat – a munkahelyi döntések automatizálásához ugyanis rengeteg érzékeny adat, finom döntés és összetett folyamat szükséges. Egy részleges kódjavaslat vagy egy jól körülhatárolható automatizáció ehhez képest csak csekély sikernek számít.

Az adatvédelmi aggályok is komolyak: az MI-ügynököknek ugyanis szenzitív adatokhoz kellene hozzáférniük, ha helyettünk dolgoznának. A Salesforce szakemberei Customer Relationship Management (CRM) környezetben is letesztelték a nagy MI-modelleket: ott egyszerű, egyfordulós feladatoknál még elfogadható, 58 százalékos sikerarányt mértek, többlépéses feladatoknál viszont már csak 35 százalékosat. Ezek a modellek szinte teljesen érzéketlenek a bizalmasságra – ez pedig IT-biztonsági kihívást jelentene minden vállalat számára.

A jövő: kevesebb hype, lassú haladás

A Gartner elemzése szerint ma kevés az igazán életképes ügynöki MI-megoldás, hiszen ezek jelenleg nem elég kiforrottak ahhoz, hogy önállóan elboldoguljanak a komplex üzleti döntésekkel vagy a bonyolult munkafolyamatokkal. Jelenleg is dollármilliárdokat öntenek olyan projektekbe, amelyeknél a valódi üzleti eredmények vagy a befektetés-arányos megtérülés (ROI) még várat magára.

Mégis, a szakértők hisznek abban, hogy 2028-ra a mindennapos munkahelyi döntések mintegy 15 százalékát már MI-ügynökök hozzák meg automatikusan, ami óriási ugrás a tavalyi 0 százalékról. Az is várható, hogy négy év múlva a vállalati szoftverek harmadában már ügynöki MI segíti majd a munkát – feltéve, hogy a fejlesztők és a piac túl tudnak jutni a rengeteg kudarcélményen.

2025, adminboss, www.theregister.com alapján

  • Te egyetértesz azzal, hogy ennyi pénzt költenek ezekre az MI-fejlesztésekre?
  • Ha vezető lennél, bízol abban, hogy az ügynöki MI képes lenne döntéseket hozni helyetted?
  • Szerinted etikus, hogy sok cég régi szoftvereket új "MI" név alatt árul?


Legfrissebb posztok

MA 12:34

Az űrállomásról rajtolhat az első űrbéli orvosi mentés

Az amerikai űrügynökség minden eddiginél komolyabb orvosi vészhelyzet elé nézhet: az egyik űrhajós a Nemzetközi Űrállomáson (ISS) váratlanul egészségügyi problémákat tapasztalt, ezért egy előre tervezett űrsétát elhalasztottak, és felmerült, hogy a legénység egy részét előbb kell hazahozni, mint ahogy eredetileg tervezték...

MA 12:02

Vége az álomnak: a Ballie sosem költözik be otthonainkba?

😪 Hat év fejlesztés és ígérgetés után a Samsung Ballie nevű otthoni robotja végleg eltűnt a vásárlók elől, és már csak belső céges projektté silányult...

MA 11:49

Az ifjú galaxisfürt, amely megrengeti a kozmológiai elméleteket

Különösen figyelemre méltó, hogy egy nemzetközi kutatócsoport olyan galaxisfürtöt azonosított, amely a feltételezettnél jóval korábban és jóval magasabb hőmérsékleten jelent meg az univerzumban, mint amit a mai elméletek megengednének...

MA 10:58

A meglepő ok, amiért jéghidegnek érezzük a vizet mentolos fogkrém után

👀 Külön említést érdemel, hogy sokan ismerik a pillanatot, amikor fogmosás után iszunk egy korty vizet, és az hirtelen jéghidegnek tűnik, sőt, a levegővétel is hűsítő élményt nyújt...

MA 10:50

A rendszeres mozgás felérhet a terápiával depresszió ellen

Világszerte több mint 280 millió embert érint a depresszió, amely komoly terhet ró az egészségügyre és az érintettekre...

MA 10:43

A Chase veszi át az Apple hitelkártyáját – jön a váltás

Az Apple Card felhasználók egyelőre nem fognak változást érzékelni, miután az Apple hivatalosan bejelentette, hogy a JPMorgan Chase váltja a Goldman Sachsot a hitelkártya-kibocsátójaként...

MA 10:36

A Ford MI-asszisztense új korszakot nyit az autózásban

Ford bejelentette, hogy hamarosan MI-asszisztenssel és továbbfejlesztett BlueCruise technológiával frissíti szolgáltatásait...

MA 10:29

A természet utolsó menedékei riasztó ütemben tűnnek el

🌳 A világ szárazföldi biodiverzitás szempontjából legfontosabb területeit, az úgynevezett „hotspotokat” egy új kutatás szerint súlyosan terheli az emberi földhasználat...

MA 10:22

A Disney+ belép a függőleges videók korszakába

Idén érkezik a Disney+ újítása: a függőleges videófolyam, amely a TikTok sikerét lovagolja meg...

MA 10:08

Az ultragyors UV-fény átírhatja a kommunikáció és a képalkotás szabályait

Továbbá megemlíthető, hogy a fotonikus technológiák, amelyek az ultraibolya (UV-C) tartományban (100–280 nm) működnek, már most kulcsszerepet játszanak számos területen, a szuperfelbontású mikroszkópiától az optikai kommunikációig...

MA 10:02

A Grok-bot botránya: kiskorúakat ábrázoló szexuális képek a sötét weben

Az internet biztonságáért küzdő szervezetek komoly figyelmeztetést adtak ki: az Elon Musk tulajdonában lévő Grok MI-chatbotot bűnözők használták fel gyermekekről készült szexuális képek létrehozásához...

MA 09:43

A Dell 52 colos, 6K-s óriása letarolja a piacot

A Dell bemutatta az UltraSharp 52 Thunderbolt Hub monitort, amely igazi óriás: 132 cm-es (52 hüvelykes) képátlójával és elképesztő 6K felbontásával jelenleg egyedülálló a világon...

MA 09:36

Az MI a Fordokba költözik – és ez már valóság

🚗 A Ford is beszáll az MI-alapú élményversenybe: 2026-tól a gyártó autóiban személyre szabott digitális asszisztens segíti majd a sofőrt és az utasokat...

MA 09:29

A trónról taszítva: zuhan a ChatGPT népszerűsége

ChatGPT piaci részesedése jelentősen visszaesett, miközben a Google Gemini egyre nagyobb teret hódít a weben...

MA 09:22

Az Apple-gépeken leálltak a Logitech appok – kitört a káosz

A Logitech Options+ és G HUB alkalmazások hirtelen működésképtelenné váltak Macen, miután egy lejárt tanúsítvány blokkolta az indításukat...

MA 09:08

A JPMorgan veszi át az Apple Cardot – végre búcsú a Goldmantól

Az Apple hivatalosan bejelentette, hogy az Apple Card új kibocsátója a JPMorgan Chase lesz...

MA 09:01

Az OpenAI nem használja fel egészségügyi adataidat MI-képzéshez

💉 Az OpenAI elindítja a ChatGPT Health nevű új funkciót, amely kizárólag egészségügyi beszélgetésekre készült, és biztonságos, privát teret kínál a felhasználóknak...

MA 08:57

A kínai MI új ragadozója berobban a hongkongi tőzsdére

📈 Kína vezető MI-fejlesztője, a Zhipu részvényei sikeresen debütáltak a hongkongi tőzsdén, miután 558 millió dolláros (207 milliárd forint) IPO-jával elsőként a kínai „MI-tigrisek” közül vált nyilvános részvénytársasággá...

MA 08:43

Az OpenAI már az egészségügyi adataidra is szemet vetett

Az OpenAI új lehetőséget mutatott be: hamarosan feltöltheted egészségügyi adataidat a ChatGPT-be, azaz megoszthatod vele orvosi leleteidet, vizsgálati eredményeidet vagy a fitneszalkalmazásokból származó információkat...