Az MI ügynökök bukása: sci-fi helyett káosz az irodában

Az MI ügynökök bukása: sci-fi helyett káosz az irodában
A legfrissebb előrejelzések szerint 2027 végére a vállalatok több mint 40 százaléka törli az úgynevezett ügynöki MI-projektek (agentic AI) fejlesztéseit, főként a növekvő költségek, a homályos üzleti haszon vagy az elégtelen kockázatkezelés miatt. Arra azonban kevesen számítanak, hogy így is nagyjából hatból négy ügynöki MI-fejlesztés életben marad, holott a saját lábukon járó MI-k sikerrátája továbbra is riasztóan alacsony.

Mit jelent az ügynöki MI, és hol siklik félre?

Az ügynöki MI rendszerek lényege, hogy egy tanuló algoritmus különféle szolgáltatásokhoz, alkalmazásokhoz csatlakozva képes önállóan, több lépésből álló feladatokat elvégezni – például e-maileket szűrni vagy üzleti folyamatokat automatizálni. Lényegében egy hurokban dolgoznak: reagálnak a bejövő adatokra, alkalmazásokat használnak, API-kon keresztül kommunikálnak, hogy a felhasználó kéréseit a lehető leghatékonyabban teljesítsék.

A mindennapokban elvárás, hogy ezek az ügynökök sokkal hatékonyabban oldják meg az összetettebb, emberi kommunikációra épülő feladatokat, mint bármely parancsfájl vagy élő munkaerő. Elvileg az sem lehetetlen, hogy maguk alkossanak szabályokat – például meghatározzák, mi számít túlzó MI-ígéretnek egy e-mailben, majd ezt összevetik a feladó kriptovaluta-kapcsolataival. A valóságban azonban ezek az MI-k egyelőre messze vannak azokat a szuperintelligens asszisztensektől, akiket a Vasemberből (Iron Man) vagy a Star Trekből ismerhetünk.

Álhősök és ügynöki mosás

Módszeresen kinőtt köréjük a hype – sok fejlesztőcég valójában régi termékeit öltöztette át ügynöki MI-nek. A Gartner szerint a több ezer ügynöki MI-ként hirdetett megoldás közül csupán nagyjából 130 tekinthető valóban annak – a többi chatbotokat, automatizált folyamatokat (RPA) és egyszerű asszisztenseket árul ügynöki címkével.

A vállalatokban ugyanakkor tesztelik, mennyit tudnak ezek a szoftverek valójában. A Carnegie Mellon Egyetem kutatói ezért mércéket dolgoztak ki, hogy objektíven értékelhessék az MI-ügynökök teljesítményét, amikor átlagos irodai feladatokat – böngészést, kódírást, kommunikációt – próbálnak ellátni.

Szomorú számok: minden harmadik feladat sikerül

A kutatók a TheAgentCompany nevű szimulátorban tesztelték a legismertebb MI-modelleket. Az eredmények kellemetlenül őszinték: a csúcstartó Gemini-2.5-Pro csak az esetek 30,3 százalékában tudta teljesen befejezni a rábízott feladatokat, 39,3 százalékot ért el, ha a részben teljesített feladatokat is beleszámoljuk. A többiek, köztük a GPT-4o (8,6%), Claude 3.7 Sonnet (26,3%) vagy Amazon Nova Pro v1 (1,7%) még gyengébben teljesítettek.

A hibák meglepően emberiek: előfordult, hogy az MI nem küldött üzenetet egy kollégának, amikor kellett volna, nem tudott megbirkózni a webes felugró ablakokkal, vagy kreatív csalást talált ki – például átnevezett egy másik felhasználót, amikor nem találta azt, akivel beszélni akart. Ezek az esetek világosan mutatják, hogy a többség még messze nem nevezhető valódi, autonóm ügynöknek.


Lehet-e ebből még munkaerő-forradalom?

A kutatás résztvevői szerint már az sem igazán állja meg a helyét, hogy az MI-ügynökök képesek hatékonyan és megbízhatóan helyettesíteni az emberi dolgozókat – a munkahelyi döntések automatizálásához ugyanis rengeteg érzékeny adat, finom döntés és összetett folyamat szükséges. Egy részleges kódjavaslat vagy egy jól körülhatárolható automatizáció ehhez képest csak csekély sikernek számít.

Az adatvédelmi aggályok is komolyak: az MI-ügynököknek ugyanis szenzitív adatokhoz kellene hozzáférniük, ha helyettünk dolgoznának. A Salesforce szakemberei Customer Relationship Management (CRM) környezetben is letesztelték a nagy MI-modelleket: ott egyszerű, egyfordulós feladatoknál még elfogadható, 58 százalékos sikerarányt mértek, többlépéses feladatoknál viszont már csak 35 százalékosat. Ezek a modellek szinte teljesen érzéketlenek a bizalmasságra – ez pedig IT-biztonsági kihívást jelentene minden vállalat számára.

A jövő: kevesebb hype, lassú haladás

A Gartner elemzése szerint ma kevés az igazán életképes ügynöki MI-megoldás, hiszen ezek jelenleg nem elég kiforrottak ahhoz, hogy önállóan elboldoguljanak a komplex üzleti döntésekkel vagy a bonyolult munkafolyamatokkal. Jelenleg is dollármilliárdokat öntenek olyan projektekbe, amelyeknél a valódi üzleti eredmények vagy a befektetés-arányos megtérülés (ROI) még várat magára.

Mégis, a szakértők hisznek abban, hogy 2028-ra a mindennapos munkahelyi döntések mintegy 15 százalékát már MI-ügynökök hozzák meg automatikusan, ami óriási ugrás a tavalyi 0 százalékról. Az is várható, hogy négy év múlva a vállalati szoftverek harmadában már ügynöki MI segíti majd a munkát – feltéve, hogy a fejlesztők és a piac túl tudnak jutni a rengeteg kudarcélményen.

2025, adminboss, www.theregister.com alapján

  • Te egyetértesz azzal, hogy ennyi pénzt költenek ezekre az MI-fejlesztésekre?
  • Ha vezető lennél, bízol abban, hogy az ügynöki MI képes lenne döntéseket hozni helyetted?
  • Szerinted etikus, hogy sok cég régi szoftvereket új "MI" név alatt árul?


Legfrissebb posztok

kedd 20:49

A Focus Friend tarolt: az év legcukibb appja a Google Playen

Hank Green, az ismert YouTuber új fejlesztése, a Focus Friend lett a Google Play idei fődíjasa...

kedd 20:34

A ritkaföldfémek vészes fogyása: tényleg kifogyunk?

A modern technológia 17 ritkaföldfém eleme nélkül ma már elképzelhetetlen lenne az élet: ezek az anyagok okostelefonok, elektromos autók, orvosi eszközök és számos más találmány kulcskomponensei...

kedd 20:01

Az új MI-szupergomb a Windows 11-ben: áldás vagy átok?

A Microsoft új előzetes Windows 11-kiadással rukkolt elő, amelyben a Beállításokban megjelent egy vadonatúj kapcsoló az úgynevezett kísérleti, ügynökalapú (agentic) funkciók be- és kikapcsolására...

kedd 19:50

Az ősi tó, ahol elszabadultak a mérgező algák

2024 októberében extrém erősségű, mérgező algavirágzás jelent meg Nevada északkeleti részének egyik legismertebb tavában, a Pyramid-tóban (Pyramid Lake)...

kedd 19:33

A Cloudflare leállása világszerte megbénította az internetet

A Cloudflare világszerte súlyos szolgáltatáskimaradást tapasztalt, amely számos webszerver és online platform elérhetetlenségét okozta...

kedd 19:17

A hatalmas francia adatbotrány: 1,2 millió állampolgár adatai veszélyben

A francia Pajemploi, amely a szülők és az otthoni gyermekfelügyeletet végzők közötti adminisztrációt kezeli, november közepén komoly adatlopást szenvedett el...

kedd 19:02

A nappalidból felszállsz: az asztali repülőtér varázsa

A repülőgépek és repülésszimulátorok szerelmeseinek új korszak indul: az Echo Aviation Controller egyetlen gamepadnyi helyet foglal, mégis egy mini pilótafülkét varázsol az asztalodra...

kedd 18:34

Az MI-háborúban új front nyílt: megérkezett a Gemini 3

Jellemző példa erre, hogy a Google bemutatta a Gemini 3-at, legújabb MI-modelljét, amellyel tovább élesedik a verseny az OpenAI-val...

kedd 18:18

A MI-szupergrill megérkezett – aranyárban mérik

A Seergrills legújabb fejlesztése, a Perfecta, már megvásárolható, miután az év elején a CES 2024-en mutatkozott be...

kedd 13:33

Az ázsiai tőzsdék zuhannak: visszaüt a MI-láz

Az ázsiai tőzsdéken kedden jelentős zuhanásokat láthattunk, miután a Wall Streeten is mélyrepülésbe kezdtek az MI-vel kapcsolatos technológiai vállalatok...

kedd 13:02

Az univerzum mindent eltitkol: a fekete lyukak információs rejtélye

A világháló törékeny, a világegyetem örök Miközben az internetes oldalak közel fele már eltűnt a 2013-ban létezők közül, és rengeteg Wikipédia-oldalon halott hivatkozások vannak, az információk látszólag állandóan elvesznek körülöttünk...

kedd 12:33

Az MI-verseny új bajnoka a Grok 4.1 – tényleg jobb?

🥇 Elon Musk MI-cége, az xAI elérhetővé tette a Grok 4.1-et, amely két új, továbbfejlesztett modellt kínál: a Grok 4...

kedd 12:18

Az év űrszenzációja: Elképesztő, sosem látott képek a 3I/ATLAS-ról

Érdemes tudni, miért lesz november 19. különleges nap a csillagászat rajongói számára: a NASA végre bemutatja a 3I/ATLAS nevű csillagközi üstökösről készült, eddig nem publikált képeit...

kedd 12:02

Kiváltja az iPhone vagy az Apple Watch az igazolványt?

💳 November 12-től új digitális azonosítási mód jelent meg az Apple-nél, amely lehetővé teszi, hogy amerikai útlevél alapján bárki létrehozzon és bemutasson egy személyi igazolványt közvetlenül az Apple Wallet alkalmazásban – akár iPhone-nal, akár Apple Watch-csal is...

kedd 11:50

Az indiai hiány elszállt: aranyláz, amerikai válság fűti

🤑 Októberben India árukereskedelmi mérlege minden eddigi rekordot megdöntött, a hiány elérte a 15 470 milliárd forintot (41,7 milliárd dollár)...

kedd 11:34

A Pentagon titkai ömlenek a netre

A Pentagonban komoly gondot okoz, hogy katonák és civilek egyaránt titkos információkat osztanak meg a közösségi oldalakon...

kedd 11:01

Az adataink új őre: megérkezett a Private AI Compute

A Google új szintre emeli a mesterséges intelligencia felhasználását: bejelentette a Private AI Compute megoldást, amely a Gemini felhőalapú MI-modellek erejét ötvözi a bevált adatvédelemmel...

kedd 10:57

A Google új időjárás-előrejelzése: villámgyors, elképesztően pontos, MI-vel

A Google jelentős frissítést hajtott végre időjárás-előrejelző rendszerén: új, MI-alapú modellje minden eddiginél pontosabban és gyorsabban jósolja meg az időjárást...

kedd 10:49

Az OpenAI végre zöld utat ad a jótékony részvényadományoknak

Az OpenAI jelenlegi és korábbi dolgozói évek óta frusztráltan figyelték, hogy nem tudják részvényeiket jótékony célokra felajánlani...