Az MI ügynökök bukása: sci-fi helyett káosz az irodában

Az MI ügynökök bukása: sci-fi helyett káosz az irodában
A legfrissebb előrejelzések szerint 2027 végére a vállalatok több mint 40 százaléka törli az úgynevezett ügynöki MI-projektek (agentic AI) fejlesztéseit, főként a növekvő költségek, a homályos üzleti haszon vagy az elégtelen kockázatkezelés miatt. Arra azonban kevesen számítanak, hogy így is nagyjából hatból négy ügynöki MI-fejlesztés életben marad, holott a saját lábukon járó MI-k sikerrátája továbbra is riasztóan alacsony.

Mit jelent az ügynöki MI, és hol siklik félre?

Az ügynöki MI rendszerek lényege, hogy egy tanuló algoritmus különféle szolgáltatásokhoz, alkalmazásokhoz csatlakozva képes önállóan, több lépésből álló feladatokat elvégezni – például e-maileket szűrni vagy üzleti folyamatokat automatizálni. Lényegében egy hurokban dolgoznak: reagálnak a bejövő adatokra, alkalmazásokat használnak, API-kon keresztül kommunikálnak, hogy a felhasználó kéréseit a lehető leghatékonyabban teljesítsék.

A mindennapokban elvárás, hogy ezek az ügynökök sokkal hatékonyabban oldják meg az összetettebb, emberi kommunikációra épülő feladatokat, mint bármely parancsfájl vagy élő munkaerő. Elvileg az sem lehetetlen, hogy maguk alkossanak szabályokat – például meghatározzák, mi számít túlzó MI-ígéretnek egy e-mailben, majd ezt összevetik a feladó kriptovaluta-kapcsolataival. A valóságban azonban ezek az MI-k egyelőre messze vannak azokat a szuperintelligens asszisztensektől, akiket a Vasemberből (Iron Man) vagy a Star Trekből ismerhetünk.

Álhősök és ügynöki mosás

Módszeresen kinőtt köréjük a hype – sok fejlesztőcég valójában régi termékeit öltöztette át ügynöki MI-nek. A Gartner szerint a több ezer ügynöki MI-ként hirdetett megoldás közül csupán nagyjából 130 tekinthető valóban annak – a többi chatbotokat, automatizált folyamatokat (RPA) és egyszerű asszisztenseket árul ügynöki címkével.

A vállalatokban ugyanakkor tesztelik, mennyit tudnak ezek a szoftverek valójában. A Carnegie Mellon Egyetem kutatói ezért mércéket dolgoztak ki, hogy objektíven értékelhessék az MI-ügynökök teljesítményét, amikor átlagos irodai feladatokat – böngészést, kódírást, kommunikációt – próbálnak ellátni.

Szomorú számok: minden harmadik feladat sikerül

A kutatók a TheAgentCompany nevű szimulátorban tesztelték a legismertebb MI-modelleket. Az eredmények kellemetlenül őszinték: a csúcstartó Gemini-2.5-Pro csak az esetek 30,3 százalékában tudta teljesen befejezni a rábízott feladatokat, 39,3 százalékot ért el, ha a részben teljesített feladatokat is beleszámoljuk. A többiek, köztük a GPT-4o (8,6%), Claude 3.7 Sonnet (26,3%) vagy Amazon Nova Pro v1 (1,7%) még gyengébben teljesítettek.

A hibák meglepően emberiek: előfordult, hogy az MI nem küldött üzenetet egy kollégának, amikor kellett volna, nem tudott megbirkózni a webes felugró ablakokkal, vagy kreatív csalást talált ki – például átnevezett egy másik felhasználót, amikor nem találta azt, akivel beszélni akart. Ezek az esetek világosan mutatják, hogy a többség még messze nem nevezhető valódi, autonóm ügynöknek.


Lehet-e ebből még munkaerő-forradalom?

A kutatás résztvevői szerint már az sem igazán állja meg a helyét, hogy az MI-ügynökök képesek hatékonyan és megbízhatóan helyettesíteni az emberi dolgozókat – a munkahelyi döntések automatizálásához ugyanis rengeteg érzékeny adat, finom döntés és összetett folyamat szükséges. Egy részleges kódjavaslat vagy egy jól körülhatárolható automatizáció ehhez képest csak csekély sikernek számít.

Az adatvédelmi aggályok is komolyak: az MI-ügynököknek ugyanis szenzitív adatokhoz kellene hozzáférniük, ha helyettünk dolgoznának. A Salesforce szakemberei Customer Relationship Management (CRM) környezetben is letesztelték a nagy MI-modelleket: ott egyszerű, egyfordulós feladatoknál még elfogadható, 58 százalékos sikerarányt mértek, többlépéses feladatoknál viszont már csak 35 százalékosat. Ezek a modellek szinte teljesen érzéketlenek a bizalmasságra – ez pedig IT-biztonsági kihívást jelentene minden vállalat számára.

A jövő: kevesebb hype, lassú haladás

A Gartner elemzése szerint ma kevés az igazán életképes ügynöki MI-megoldás, hiszen ezek jelenleg nem elég kiforrottak ahhoz, hogy önállóan elboldoguljanak a komplex üzleti döntésekkel vagy a bonyolult munkafolyamatokkal. Jelenleg is dollármilliárdokat öntenek olyan projektekbe, amelyeknél a valódi üzleti eredmények vagy a befektetés-arányos megtérülés (ROI) még várat magára.

Mégis, a szakértők hisznek abban, hogy 2028-ra a mindennapos munkahelyi döntések mintegy 15 százalékát már MI-ügynökök hozzák meg automatikusan, ami óriási ugrás a tavalyi 0 százalékról. Az is várható, hogy négy év múlva a vállalati szoftverek harmadában már ügynöki MI segíti majd a munkát – feltéve, hogy a fejlesztők és a piac túl tudnak jutni a rengeteg kudarcélményen.

2025, adminboss, www.theregister.com alapján

  • Te egyetértesz azzal, hogy ennyi pénzt költenek ezekre az MI-fejlesztésekre?
  • Ha vezető lennél, bízol abban, hogy az ügynöki MI képes lenne döntéseket hozni helyetted?
  • Szerinted etikus, hogy sok cég régi szoftvereket új "MI" név alatt árul?



Legfrissebb posztok

Ezeket az iPhone trükköket sokan nem ismerik, vajon te tudod?

MA 23:52

Ezeket az iPhone trükköket sokan nem ismerik, vajon te tudod?

Az iPhone-t szinte mindannyian nap mint nap használjuk, mégis gyakran rejtve maradnak előttünk azok a kis extra funkciók, amelyek megkönnyíthetnék az életünket. Az iPhone-ok folyamatos okosításának hála ma...

Az európai vizek rejtett problémái a műholdak szemével

MA 22:51

Az európai vizek rejtett problémái a műholdak szemével

Európa folyói és felszíni vízkészletei rendkívüli nyomás alatt állnak a klímaváltozás miatt, de a jelenleg elterjedt műholdas mérési technológiák gyakran alulbecsülik a változások mértékét. A Föld gravitációs mezeje...

Az átverés, amely még a MI-t is becsapta

MA 22:26

Az átverés, amely még a MI-t is becsapta

Egy nebraskai férfit, Charles O. Parks III-t egy év börtönbüntetésre ítéltek, miután több mint egymilliárd forint (3,5 millió USD) értékű csalást követett el felhőszolgáltató cégek kárára, hogy közel...

Senki sem szereti az MI-t, az új szleng mindent elárul

MA 22:02

Senki sem szereti az MI-t, az új szleng mindent elárul

😷 Miközben Sam Altman, Elon Musk és mások szinte ódákat zengenek a mesterséges intelligenciáról, egyre többen fordulnak el tőle Amerikában. A YouGov friss adatai szerint az amerikaiak 43 százaléka...

Az Otter MI titokban rögzíti a megbeszéléseidet?

MA 21:51

Az Otter MI titokban rögzíti a megbeszéléseidet?

Az Otter MI jegyzetelő asszisztense már régóta képes arra, hogy Zoom, Google Meet vagy Microsoft Teams hívásokba becsatlakozva valós időben feljegyezze a résztvevők mondanivalóját. Most azonban egy frissen...

Az összeomló Coinbase: miért zuhan a részvény?

MA 21:26

Az összeomló Coinbase: miért zuhan a részvény?

📉 A Coinbase Global részvényei pénteken több mint 15%-ot estek, egy hónapja nem voltak ilyen alacsonyan, miután a cég második negyedéves nyeresége és forgalma messze elmaradt a várakozásoktól. A...

Az új MI-védelem a Teamsben: végre nem dől be mindenki

MA 21:01

Az új MI-védelem a Teamsben: végre nem dől be mindenki

🧐 A Microsoft Teams hamarosan még biztonságosabbá válik: a fejlesztők mostantól automatikusan blokkolják a veszélyes fájltípusokat, például a futtatható, .exe kiterjesztésű fájlokat a csevegésekben és a csatornákban. Az új...

A laptopok vége a munkahelyeken? Jön a felhős PC

MA 20:51

A laptopok vége a munkahelyeken? Jön a felhős PC

A Gartner friss adatai szerint már olcsóbb és egyszerűbb a Desktop-as-a-Service (DaaS) használata, mint az irodai laptopoké. 2027-re várhatóan a dolgozók 95%-ánál költséghatékonyabb lesz a DaaS, míg 2019-ben...

Az MI-cég, amelyik 12 billióért akarja megvenni a Google Chromét

MA 20:01

Az MI-cég, amelyik 12 billióért akarja megvenni a Google Chromét

💸 A Perplexity nevű MI-vállalat komoly feltűnést keltett azzal, hogy 13 000 milliárd forintért (34,5 milliárd USD) készpénzben ajánlatot tett a Google Chrome böngésző megvásárlására – annak ellenére, hogy...