Az MI ügynökök bukása: sci-fi helyett káosz az irodában

Az MI ügynökök bukása: sci-fi helyett káosz az irodában
A legfrissebb előrejelzések szerint 2027 végére a vállalatok több mint 40 százaléka törli az úgynevezett ügynöki MI-projektek (agentic AI) fejlesztéseit, főként a növekvő költségek, a homályos üzleti haszon vagy az elégtelen kockázatkezelés miatt. Arra azonban kevesen számítanak, hogy így is nagyjából hatból négy ügynöki MI-fejlesztés életben marad, holott a saját lábukon járó MI-k sikerrátája továbbra is riasztóan alacsony.

Mit jelent az ügynöki MI, és hol siklik félre?

Az ügynöki MI rendszerek lényege, hogy egy tanuló algoritmus különféle szolgáltatásokhoz, alkalmazásokhoz csatlakozva képes önállóan, több lépésből álló feladatokat elvégezni – például e-maileket szűrni vagy üzleti folyamatokat automatizálni. Lényegében egy hurokban dolgoznak: reagálnak a bejövő adatokra, alkalmazásokat használnak, API-kon keresztül kommunikálnak, hogy a felhasználó kéréseit a lehető leghatékonyabban teljesítsék.

A mindennapokban elvárás, hogy ezek az ügynökök sokkal hatékonyabban oldják meg az összetettebb, emberi kommunikációra épülő feladatokat, mint bármely parancsfájl vagy élő munkaerő. Elvileg az sem lehetetlen, hogy maguk alkossanak szabályokat – például meghatározzák, mi számít túlzó MI-ígéretnek egy e-mailben, majd ezt összevetik a feladó kriptovaluta-kapcsolataival. A valóságban azonban ezek az MI-k egyelőre messze vannak azokat a szuperintelligens asszisztensektől, akiket a Vasemberből (Iron Man) vagy a Star Trekből ismerhetünk.

Álhősök és ügynöki mosás

Módszeresen kinőtt köréjük a hype – sok fejlesztőcég valójában régi termékeit öltöztette át ügynöki MI-nek. A Gartner szerint a több ezer ügynöki MI-ként hirdetett megoldás közül csupán nagyjából 130 tekinthető valóban annak – a többi chatbotokat, automatizált folyamatokat (RPA) és egyszerű asszisztenseket árul ügynöki címkével.

A vállalatokban ugyanakkor tesztelik, mennyit tudnak ezek a szoftverek valójában. A Carnegie Mellon Egyetem kutatói ezért mércéket dolgoztak ki, hogy objektíven értékelhessék az MI-ügynökök teljesítményét, amikor átlagos irodai feladatokat – böngészést, kódírást, kommunikációt – próbálnak ellátni.

Szomorú számok: minden harmadik feladat sikerül

A kutatók a TheAgentCompany nevű szimulátorban tesztelték a legismertebb MI-modelleket. Az eredmények kellemetlenül őszinték: a csúcstartó Gemini-2.5-Pro csak az esetek 30,3 százalékában tudta teljesen befejezni a rábízott feladatokat, 39,3 százalékot ért el, ha a részben teljesített feladatokat is beleszámoljuk. A többiek, köztük a GPT-4o (8,6%), Claude 3.7 Sonnet (26,3%) vagy Amazon Nova Pro v1 (1,7%) még gyengébben teljesítettek.

A hibák meglepően emberiek: előfordult, hogy az MI nem küldött üzenetet egy kollégának, amikor kellett volna, nem tudott megbirkózni a webes felugró ablakokkal, vagy kreatív csalást talált ki – például átnevezett egy másik felhasználót, amikor nem találta azt, akivel beszélni akart. Ezek az esetek világosan mutatják, hogy a többség még messze nem nevezhető valódi, autonóm ügynöknek.


Lehet-e ebből még munkaerő-forradalom?

A kutatás résztvevői szerint már az sem igazán állja meg a helyét, hogy az MI-ügynökök képesek hatékonyan és megbízhatóan helyettesíteni az emberi dolgozókat – a munkahelyi döntések automatizálásához ugyanis rengeteg érzékeny adat, finom döntés és összetett folyamat szükséges. Egy részleges kódjavaslat vagy egy jól körülhatárolható automatizáció ehhez képest csak csekély sikernek számít.

Az adatvédelmi aggályok is komolyak: az MI-ügynököknek ugyanis szenzitív adatokhoz kellene hozzáférniük, ha helyettünk dolgoznának. A Salesforce szakemberei Customer Relationship Management (CRM) környezetben is letesztelték a nagy MI-modelleket: ott egyszerű, egyfordulós feladatoknál még elfogadható, 58 százalékos sikerarányt mértek, többlépéses feladatoknál viszont már csak 35 százalékosat. Ezek a modellek szinte teljesen érzéketlenek a bizalmasságra – ez pedig IT-biztonsági kihívást jelentene minden vállalat számára.

A jövő: kevesebb hype, lassú haladás

A Gartner elemzése szerint ma kevés az igazán életképes ügynöki MI-megoldás, hiszen ezek jelenleg nem elég kiforrottak ahhoz, hogy önállóan elboldoguljanak a komplex üzleti döntésekkel vagy a bonyolult munkafolyamatokkal. Jelenleg is dollármilliárdokat öntenek olyan projektekbe, amelyeknél a valódi üzleti eredmények vagy a befektetés-arányos megtérülés (ROI) még várat magára.

Mégis, a szakértők hisznek abban, hogy 2028-ra a mindennapos munkahelyi döntések mintegy 15 százalékát már MI-ügynökök hozzák meg automatikusan, ami óriási ugrás a tavalyi 0 százalékról. Az is várható, hogy négy év múlva a vállalati szoftverek harmadában már ügynöki MI segíti majd a munkát – feltéve, hogy a fejlesztők és a piac túl tudnak jutni a rengeteg kudarcélményen.

2025, adminboss, www.theregister.com alapján

  • Te egyetértesz azzal, hogy ennyi pénzt költenek ezekre az MI-fejlesztésekre?
  • Ha vezető lennél, bízol abban, hogy az ügynöki MI képes lenne döntéseket hozni helyetted?
  • Szerinted etikus, hogy sok cég régi szoftvereket új "MI" név alatt árul?


Legfrissebb posztok

MA 20:51

Az MI-paradoxon a Stack Overflow-n: használják, mégsem bíznak benne

🤔 Amit látunk, az túlmutat a megszokotton: a Stack Overflow fejlesztői közösségébe berobbant az MI, és alaposan felforgatta a mindennapokat...

MA 20:33

A Microsoft kötelező Copilotja megérkezett az LG okostévékre

Az LG okostévé-tulajdonosok hétvégén arra lettek figyelmesek, hogy a legutóbbi webOS-frissítés után akaratukon kívül megjelent a Microsoft Copilot alkalmazás a készülékeiken, és az alkalmazást nem lehet eltávolítani...

MA 20:17

A brit meztelenfotó-blokkolás már az Apple-t és a Google-t is eléri

A brit kormány jelentős nyomást gyakorol az Apple-re és a Google-re: a techóriásoknak blokkolniuk kellene a meztelen képek megosztását és megjelenítését minden iOS- és Android-eszközön, ha a felhasználó életkorát nem igazolták...

MA 20:01

Az ingyenes MI-funkció eltűnése felbőszítette a Google-felhasználókat

😡 Sokan bosszankodnak, mert a Google Home-on megszokott egyik legfontosabb MI-funkció fizetős lett...

MA 19:49

A szennyezett ivóvíz növelheti a Parkinson-kór kockázatát?

Az elmúlt évtizedekben a Parkinson-kór kutatása főként a genetikai tényezőkre koncentrált, a kutatási támogatások több mint fele genetikai vizsgálatokra jutott...

MA 19:34

Az űrbaleset küszöbén: kínai műhold 200 méterre a Starlinktől

A SpaceX egyik vezetője állítja, hogy egy kínai műhold indítása során mindössze 200 méterre haladt el egy Starlink-műhold mellett – hajszálon múlt egy potenciális baleset...

MA 19:19

Az 5K monitor harmadáron: tényleg ennyire jó?

Érdemes megvizsgálni, hogy érdemes-e a méregdrága Apple Studio Display helyett olcsóbb alternatíván gondolkodni, ha 5K felbontású monitorra vágyik az ember...

MA 18:49

Az egyszerű szokások, amelyek akár 8 évvel fiatalítják az agyat

💡 Új kutatás szerint az agy valós életkora sokkal inkább függ a napi szokásoktól, mint a születési dátumtól...

MA 18:34

Az ősi himalájai égetés visszahozhatná az erdők életét

A tél beköszöntével december és január folyamán Uttarakhand hegyvidéki régióiban a helyi közösségek régi hagyomány szerint irányított égetésekkel újítják meg a hegyi legelők füvét...

MA 18:17

Az Apple újra foltoz: súlyos MI-támadás érte

Két komoly, eddig ismeretlen sebezhetőséget javított az Apple, miután egy rendkívül kifinomult támadást fedeztek fel, amely akár magas rangú személyek elleni kibertámadás része is lehetett...

MA 18:03

Az évszázad forrósága, a hobbitok kihalásának rejtélye és a K-vitamin-vita

🌎 Rekordközeli hőmérsékletek, újabb járványügyi fejlemények, valamint egy közel 50 000 éves kihalás titkának megfejtése – az elmúlt hét tudományos hírei nemcsak izgalmasak, hanem meghatározók is mindannyiunk jövője szempontjából...

MA 17:49

Az olcsó SSD-k kora lejárt?

Vészesen közeledik a korszak vége azok számára, akik olcsó SSD-t keresnek: a hírek szerint a Samsung hamarosan leállítja a költséghatékony SATA SSD-k gyártását...

MA 17:17

Az űrben káosz: veszélyes kínai műhold a Starlink közelében

A SpaceX súlyos aggályokat fogalmazott meg, miután egy kínai rakétával pályára állított műhold mindössze 200 méterre haladt el az egyik működő Starlink-műhold mellett, 560 kilométeres magasságban...

MA 17:02

Az MI-fejlesztésekbe tovább ömlik a pénz

A vezetők többsége úgy látja, hogy az MI-beruházások nemcsak elbocsátásokat hoznak, hanem új munkahelyeket is teremtenek – még ha eddig kevesebb projekt vált is be, mint várták...

MA 16:50

Az év végi hajrában így döntenek jobban a vezetők decemberben

📈 Decemberben a cégeknél szinte csodával határos változás történik: a hónapokig húzódó döntések hirtelen megszületnek, projekteket hagynak jóvá, költségvetéseket véglegesítenek, és végre pont kerül a sokáig vitatott ügyek végére...

MA 16:33

Az MI új aranybányája: Fél év alatt elszálltak a bevételek

Brendan Foody mindössze 19 évesen alapította két középiskolai barátjával a Mercor nevű céget, hogy segítse ismerőseik induló vállalkozásait szoftvermérnökök felvételével, főként külföldről...

MA 16:17

A legújabb Windows-frissítés lebénítja a vállalati üzenetküldőket

🔴 A Microsoft megerősítette, hogy a 2025. decemberi biztonsági frissítések súlyos problémát okoznak a Message Queuing (MSMQ) szolgáltatásban, amely leginkább a nagyvállalati alkalmazásokat és az Internet Information Services (IIS) webhelyeket érinti...

MA 16:01

Az újabb hekkertámadás a francia minisztériumok ellen: veszélyben az érzékeny e-mailek

A francia Belügyminisztérium elismerte, hogy kibertámadás érte a tárca e-mail-szervereit: az ismeretlen támadók több dokumentumfájlokhoz is hozzáfértek...

MA 15:52

A pénztárcabarát okoskarkötő, amit minden kezdő sportoló imád

Aki most kezdene neki a rendszeres mozgásnak vagy csak szeretné a hétköznapokat sportosabbá és egészségesebbé tenni, annak az új Xiaomi Smart Band 10 több szempontból is kiváló választás lehet...