Az MI ügynökök bukása: sci-fi helyett káosz az irodában

Az MI ügynökök bukása: sci-fi helyett káosz az irodában
A legfrissebb előrejelzések szerint 2027 végére a vállalatok több mint 40 százaléka törli az úgynevezett ügynöki MI-projektek (agentic AI) fejlesztéseit, főként a növekvő költségek, a homályos üzleti haszon vagy az elégtelen kockázatkezelés miatt. Arra azonban kevesen számítanak, hogy így is nagyjából hatból négy ügynöki MI-fejlesztés életben marad, holott a saját lábukon járó MI-k sikerrátája továbbra is riasztóan alacsony.

Mit jelent az ügynöki MI, és hol siklik félre?

Az ügynöki MI rendszerek lényege, hogy egy tanuló algoritmus különféle szolgáltatásokhoz, alkalmazásokhoz csatlakozva képes önállóan, több lépésből álló feladatokat elvégezni – például e-maileket szűrni vagy üzleti folyamatokat automatizálni. Lényegében egy hurokban dolgoznak: reagálnak a bejövő adatokra, alkalmazásokat használnak, API-kon keresztül kommunikálnak, hogy a felhasználó kéréseit a lehető leghatékonyabban teljesítsék.

A mindennapokban elvárás, hogy ezek az ügynökök sokkal hatékonyabban oldják meg az összetettebb, emberi kommunikációra épülő feladatokat, mint bármely parancsfájl vagy élő munkaerő. Elvileg az sem lehetetlen, hogy maguk alkossanak szabályokat – például meghatározzák, mi számít túlzó MI-ígéretnek egy e-mailben, majd ezt összevetik a feladó kriptovaluta-kapcsolataival. A valóságban azonban ezek az MI-k egyelőre messze vannak azokat a szuperintelligens asszisztensektől, akiket a Vasemberből (Iron Man) vagy a Star Trekből ismerhetünk.

Álhősök és ügynöki mosás

Módszeresen kinőtt köréjük a hype – sok fejlesztőcég valójában régi termékeit öltöztette át ügynöki MI-nek. A Gartner szerint a több ezer ügynöki MI-ként hirdetett megoldás közül csupán nagyjából 130 tekinthető valóban annak – a többi chatbotokat, automatizált folyamatokat (RPA) és egyszerű asszisztenseket árul ügynöki címkével.

A vállalatokban ugyanakkor tesztelik, mennyit tudnak ezek a szoftverek valójában. A Carnegie Mellon Egyetem kutatói ezért mércéket dolgoztak ki, hogy objektíven értékelhessék az MI-ügynökök teljesítményét, amikor átlagos irodai feladatokat – böngészést, kódírást, kommunikációt – próbálnak ellátni.

Szomorú számok: minden harmadik feladat sikerül

A kutatók a TheAgentCompany nevű szimulátorban tesztelték a legismertebb MI-modelleket. Az eredmények kellemetlenül őszinték: a csúcstartó Gemini-2.5-Pro csak az esetek 30,3 százalékában tudta teljesen befejezni a rábízott feladatokat, 39,3 százalékot ért el, ha a részben teljesített feladatokat is beleszámoljuk. A többiek, köztük a GPT-4o (8,6%), Claude 3.7 Sonnet (26,3%) vagy Amazon Nova Pro v1 (1,7%) még gyengébben teljesítettek.

A hibák meglepően emberiek: előfordult, hogy az MI nem küldött üzenetet egy kollégának, amikor kellett volna, nem tudott megbirkózni a webes felugró ablakokkal, vagy kreatív csalást talált ki – például átnevezett egy másik felhasználót, amikor nem találta azt, akivel beszélni akart. Ezek az esetek világosan mutatják, hogy a többség még messze nem nevezhető valódi, autonóm ügynöknek.


Lehet-e ebből még munkaerő-forradalom?

A kutatás résztvevői szerint már az sem igazán állja meg a helyét, hogy az MI-ügynökök képesek hatékonyan és megbízhatóan helyettesíteni az emberi dolgozókat – a munkahelyi döntések automatizálásához ugyanis rengeteg érzékeny adat, finom döntés és összetett folyamat szükséges. Egy részleges kódjavaslat vagy egy jól körülhatárolható automatizáció ehhez képest csak csekély sikernek számít.

Az adatvédelmi aggályok is komolyak: az MI-ügynököknek ugyanis szenzitív adatokhoz kellene hozzáférniük, ha helyettünk dolgoznának. A Salesforce szakemberei Customer Relationship Management (CRM) környezetben is letesztelték a nagy MI-modelleket: ott egyszerű, egyfordulós feladatoknál még elfogadható, 58 százalékos sikerarányt mértek, többlépéses feladatoknál viszont már csak 35 százalékosat. Ezek a modellek szinte teljesen érzéketlenek a bizalmasságra – ez pedig IT-biztonsági kihívást jelentene minden vállalat számára.

A jövő: kevesebb hype, lassú haladás

A Gartner elemzése szerint ma kevés az igazán életképes ügynöki MI-megoldás, hiszen ezek jelenleg nem elég kiforrottak ahhoz, hogy önállóan elboldoguljanak a komplex üzleti döntésekkel vagy a bonyolult munkafolyamatokkal. Jelenleg is dollármilliárdokat öntenek olyan projektekbe, amelyeknél a valódi üzleti eredmények vagy a befektetés-arányos megtérülés (ROI) még várat magára.

Mégis, a szakértők hisznek abban, hogy 2028-ra a mindennapos munkahelyi döntések mintegy 15 százalékát már MI-ügynökök hozzák meg automatikusan, ami óriási ugrás a tavalyi 0 százalékról. Az is várható, hogy négy év múlva a vállalati szoftverek harmadában már ügynöki MI segíti majd a munkát – feltéve, hogy a fejlesztők és a piac túl tudnak jutni a rengeteg kudarcélményen.

2025, adminboss, www.theregister.com alapján

  • Te egyetértesz azzal, hogy ennyi pénzt költenek ezekre az MI-fejlesztésekre?
  • Ha vezető lennél, bízol abban, hogy az ügynöki MI képes lenne döntéseket hozni helyetted?
  • Szerinted etikus, hogy sok cég régi szoftvereket új "MI" név alatt árul?


Legfrissebb posztok

APP
MA 07:13

APPok, Amik Ingyenesek MA, 1/7

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Overlap: World Clock (iPhone/iPad)Az Overlap egy intelligens világóra alkalmazás, amely jelentősen megkönnyíti a különböző időzónákban élők számára az egyeztetést...

MA 06:05

Történelmi események a mai napon (Január 7.)

Röviden: ezen a napon Galileo Galilei először pillantotta meg a négy legnagyobb Jupiter-holdat, elindult a szenátusi tárgyalás Bill Clinton impeachment-ügyében, és a Charlie Hebdo elleni terrortámadás megrázta Párizst...

kedd 09:37

Az AMD újra odacsap: a Ryzen AI 400-as sorozattal ráijeszt az Intelre

Érdekes felvetés, hogy ami először apróságnak tűnt – az AMD új Ryzen 7 9850X3D-jének bejelentése –, az valójában csak a jéghegy csúcsa a 2026-os CES-en...

kedd 09:29

Az Nvidia végre a Linuxot és a Fire TV-t is komolyan veszi

🚀 Az Nvidia befejezte az RTX 5080-as frissítést a GeForce Now felhőalapú játékplatformján, és most új funkciókat kapnak az előfizetők...

kedd 09:14

Az izzó galaxishalmaz új fejezetet nyit a világegyetem történetében

💫 Egy minden eddiginél forróbb galaxishalmazt fedeztek fel a korai világegyetemben, ami teljesen váratlanul érte a csillagászokat...

kedd 09:01

Az adatbrókerek rémálma: Kalifornia kemény szabályokkal csap le

Kaliforniában januártól életbe lépett az ország legszigorúbb adatvédelmi jogszabálya, amely jelentősen leegyszerűsíti az állampolgárok számára a személyes adataik törlését és további gyűjtésük megtiltását...

kedd 08:57

Az új SmartVoice eszközök net nélkül is lehallgatnak

🔈 Az Emerson bemutatta SmartVoice nevű eszközeit, amelyekkel egyszerű hangutasításokkal irányíthatod a mindennapi háztartási gépeket, méghozzá alkalmazás, Wi‑Fi vagy bármilyen okosotthon-hub nélkül...

kedd 08:51

Az Nvidia zsebre vágható MI-gépe új ligába lépett

🤖 Érdekes felvetés, hogy egy asztali MI-minigép hirtelen a figyelem középpontjába került: az Nvidia DGX Spark a legújabb szoftverfrissítésnek köszönhetően már több mint kétszeres teljesítménynövekedést ígér októberi bemutatkozása óta...

kedd 08:43

A jövő Hyundai-gyáraiban az emberformájú robotok veszik át a munkát

🤖 A Hyundai Motor Group 2028-tól emberformájú robotokat telepít gyáraiba, ezzel lépést tartva a legnagyobb cégekkel a robotizációs versenyben...

kedd 08:36

Az Nvidia új varázslatai vas nélkül turbózzák a játékélményt

Az Nvidia a CES 2026 rendezvényen ugyan nem mutatott be új gamer hardvert, mégis fejlesztések egész sorával készült a játékosoknak – szoftveres fronton...

kedd 08:30

A nagy élelmiszermítosz: tényleg napi 200 döntést hozol?

Évek óta tartja magát az a vélekedés, hogy az emberek naponta több mint 200 döntést hoznak az ételválasztásaikkal kapcsolatban, többségük ráadásul tudat alatt...

kedd 08:23

A Ryzen AI Embedded P100 az ipari MI nagy dobása

🔧 A CES 2026 alkalmával az AMD nemcsak a szokásos asztali és mobil processzorait mutatta be, hanem végre a beágyazott piacra is komoly figyelmet fordított...

kedd 08:17

Az NVIDIA Rubin MI-platformja berobban: új szabályok jönnek

Az NVIDIA idén a 2026-os CES-en bemutatta minden eddiginél fejlettebb MI-platformját, amely Rubin névre hallgat...

kedd 08:01

A Starlink leállása lebénította a netet, forrong Pápua Új-Guinea

Az emberek egyre elégedetlenebbek Pápua Új-Guineában, miután a kormány felszólította a Starlinket, hogy szüntesse be az internetszolgáltatását...

kedd 07:57

A bitcoin 95 ezer felé száguld, az XRP berobban

A kriptovilág az év egyik legizgalmasabb napját élte át hétfőn, amikor a bitcoin árfolyama 3%-os emelkedéssel elérte a 94 400 dollárt (kb...

kedd 07:51

Az élet ára a sejtekben: a láthatatlan energiaszámla

⚡ Az élő rendszerek működéséhez a látható energiaráfordításokon túl rejtett energiaköltségek is társulnak...

kedd 07:44

Az 50 legmegdöbbentőbb tudományos tény a világról

Érdemes megvizsgálni, hogy mennyi furcsaság és meghökkentő érdekesség rejlik körülöttünk – az emberi testtől a bolygónk szélsőséges adottságaiig és a világegyetem elképesztő titkaiig...

kedd 07:36

Az új HP EliteBookokkal végre fellélegezhet az IT-részleg

A HP idén alaposan megújította az EliteBook X G2 üzleti laptopokat, amelyek most először AMD, Intel és Qualcomm processzorokkal is elérhetők ugyanazon a platformon belül...

kedd 07:29

Az Afeela elektromos autói berobbannak: PlayStation-játékokkal és egyedi hangzással

A Sony és a Honda közös vállalkozása, az Afeela, most először tartott önálló bemutatót, ahol felfedték, hogyan képzelik el a jövő villanyautóit – belül PlayStation-játékokkal, kívül vadonatúj dizájnnal...