2025. 07. 02., 09:01

Az MI ügynökök bukása: sci-fi helyett káosz az irodában

Az MI ügynökök bukása: sci-fi helyett káosz az irodában
A legfrissebb előrejelzések szerint 2027 végére a vállalatok több mint 40 százaléka törli az úgynevezett ügynöki MI-projektek (agentic AI) fejlesztéseit, főként a növekvő költségek, a homályos üzleti haszon vagy az elégtelen kockázatkezelés miatt. Arra azonban kevesen számítanak, hogy így is nagyjából hatból négy ügynöki MI-fejlesztés életben marad, holott a saját lábukon járó MI-k sikerrátája továbbra is riasztóan alacsony.

Mit jelent az ügynöki MI, és hol siklik félre?

Az ügynöki MI rendszerek lényege, hogy egy tanuló algoritmus különféle szolgáltatásokhoz, alkalmazásokhoz csatlakozva képes önállóan, több lépésből álló feladatokat elvégezni – például e-maileket szűrni vagy üzleti folyamatokat automatizálni. Lényegében egy hurokban dolgoznak: reagálnak a bejövő adatokra, alkalmazásokat használnak, API-kon keresztül kommunikálnak, hogy a felhasználó kéréseit a lehető leghatékonyabban teljesítsék.

A mindennapokban elvárás, hogy ezek az ügynökök sokkal hatékonyabban oldják meg az összetettebb, emberi kommunikációra épülő feladatokat, mint bármely parancsfájl vagy élő munkaerő. Elvileg az sem lehetetlen, hogy maguk alkossanak szabályokat – például meghatározzák, mi számít túlzó MI-ígéretnek egy e-mailben, majd ezt összevetik a feladó kriptovaluta-kapcsolataival. A valóságban azonban ezek az MI-k egyelőre messze vannak azokat a szuperintelligens asszisztensektől, akiket a Vasemberből (Iron Man) vagy a Star Trekből ismerhetünk.

Álhősök és ügynöki mosás

Módszeresen kinőtt köréjük a hype – sok fejlesztőcég valójában régi termékeit öltöztette át ügynöki MI-nek. A Gartner szerint a több ezer ügynöki MI-ként hirdetett megoldás közül csupán nagyjából 130 tekinthető valóban annak – a többi chatbotokat, automatizált folyamatokat (RPA) és egyszerű asszisztenseket árul ügynöki címkével.

A vállalatokban ugyanakkor tesztelik, mennyit tudnak ezek a szoftverek valójában. A Carnegie Mellon Egyetem kutatói ezért mércéket dolgoztak ki, hogy objektíven értékelhessék az MI-ügynökök teljesítményét, amikor átlagos irodai feladatokat – böngészést, kódírást, kommunikációt – próbálnak ellátni.

Szomorú számok: minden harmadik feladat sikerül

A kutatók a TheAgentCompany nevű szimulátorban tesztelték a legismertebb MI-modelleket. Az eredmények kellemetlenül őszinték: a csúcstartó Gemini-2.5-Pro csak az esetek 30,3 százalékában tudta teljesen befejezni a rábízott feladatokat, 39,3 százalékot ért el, ha a részben teljesített feladatokat is beleszámoljuk. A többiek, köztük a GPT-4o (8,6%), Claude 3.7 Sonnet (26,3%) vagy Amazon Nova Pro v1 (1,7%) még gyengébben teljesítettek.

A hibák meglepően emberiek: előfordult, hogy az MI nem küldött üzenetet egy kollégának, amikor kellett volna, nem tudott megbirkózni a webes felugró ablakokkal, vagy kreatív csalást talált ki – például átnevezett egy másik felhasználót, amikor nem találta azt, akivel beszélni akart. Ezek az esetek világosan mutatják, hogy a többség még messze nem nevezhető valódi, autonóm ügynöknek.


Lehet-e ebből még munkaerő-forradalom?

A kutatás résztvevői szerint már az sem igazán állja meg a helyét, hogy az MI-ügynökök képesek hatékonyan és megbízhatóan helyettesíteni az emberi dolgozókat – a munkahelyi döntések automatizálásához ugyanis rengeteg érzékeny adat, finom döntés és összetett folyamat szükséges. Egy részleges kódjavaslat vagy egy jól körülhatárolható automatizáció ehhez képest csak csekély sikernek számít.

Az adatvédelmi aggályok is komolyak: az MI-ügynököknek ugyanis szenzitív adatokhoz kellene hozzáférniük, ha helyettünk dolgoznának. A Salesforce szakemberei Customer Relationship Management (CRM) környezetben is letesztelték a nagy MI-modelleket: ott egyszerű, egyfordulós feladatoknál még elfogadható, 58 százalékos sikerarányt mértek, többlépéses feladatoknál viszont már csak 35 százalékosat. Ezek a modellek szinte teljesen érzéketlenek a bizalmasságra – ez pedig IT-biztonsági kihívást jelentene minden vállalat számára.

A jövő: kevesebb hype, lassú haladás

A Gartner elemzése szerint ma kevés az igazán életképes ügynöki MI-megoldás, hiszen ezek jelenleg nem elég kiforrottak ahhoz, hogy önállóan elboldoguljanak a komplex üzleti döntésekkel vagy a bonyolult munkafolyamatokkal. Jelenleg is dollármilliárdokat öntenek olyan projektekbe, amelyeknél a valódi üzleti eredmények vagy a befektetés-arányos megtérülés (ROI) még várat magára.

Mégis, a szakértők hisznek abban, hogy 2028-ra a mindennapos munkahelyi döntések mintegy 15 százalékát már MI-ügynökök hozzák meg automatikusan, ami óriási ugrás a tavalyi 0 százalékról. Az is várható, hogy négy év múlva a vállalati szoftverek harmadában már ügynöki MI segíti majd a munkát – feltéve, hogy a fejlesztők és a piac túl tudnak jutni a rengeteg kudarcélményen.

2025, adminboss, www.theregister.com alapján

  • Te egyetértesz azzal, hogy ennyi pénzt költenek ezekre az MI-fejlesztésekre?
  • Ha vezető lennél, bízol abban, hogy az ügynöki MI képes lenne döntéseket hozni helyetted?
  • Szerinted etikus, hogy sok cég régi szoftvereket új "MI" név alatt árul?


Legfrissebb posztok

MA 21:24

Az Artemis II legénysége visszatér – látványos vízreszállás a Csendes-óceánban

Érdekes megjegyezni, hogy négy űrhajós tíznapos, a Holdat megkerülő útja után minden a NASA tervei szerint halad...

MA 21:12

Az Alzheimer-kór elleni küzdelem válságban van – új kezelés kell!

💡 Kezdetben az Alzheimer-kór kezelése főként az agyi fehérjék, különösen az amyloid-béta eltávolítását célozta...

MA 21:01

Az FBI elolvasta a Signal-üzeneteidet – komolyan?

💁 A privacy-őrültek évekig boldogan nyomták a csetet a Signalon, hiszen csak a küldő és a fogadó látja az üzeneteket, minden szuperül titkosított, az üzenetek ráadásul idővel elpárolognak a telefonból...

MA 20:56

A Windows 11 végre megszabadul az idegesítő Copilot-gomboktól!

Na, végre! A Microsoft lassan, de biztosan leszámol azzal, hogy minden sarkon ránk erőlteti a Copilot-gombokat a Windows 11-ben...

MA 20:45

Az Asus leszámolna a videokártyák olvadásával

⚡ Az utóbbi években sok PC-rajongót tartott izgalomban vagy éppen aggodalomban a csúcskategóriás grafikus kártyák, például az RTX 4090 vagy a hamarosan megjelenő RTX 5090, valamint a hozzájuk tartozó tápkábelek leolvadása...

MA 20:34

A Starlink-forradalom küszöbén: olcsóbb, gyorsabb űrinternet?

🚀 A legfrissebb hírek szerint a műholdas internet tényleg felpöröghet, az új FCC-szabályoknak köszönhetően...

MA 20:23

A Gmail titkosítása végre teljes mobilon

🔒 Fontos kérdés, hogy mennyire védettek az e-mailek okostelefonokon. Most először vált elérhetővé a Gmail végponttól végpontig terjedő titkosítása (E2EE) minden Android- és iOS-eszközön, így a vállalati felhasználók külön alkalmazás nélkül olvashatnak és írhatnak titkosított leveleket...

MA 20:01

Az atomok fényjele leleplezheti a gravitációs hullámokat

💫 A gravitációs hullámok eddig kizárólag hatalmas, kilométeres méretű műszerekkel voltak kimutathatók; ezek apró téridő-rezgéseket érzékelnek, amelyek például fekete lyukak összeolvadásakor keletkeznek...

MA 19:56

A Play Áruházból eltűnt egy kedvelt horrorjáték – de miért?

Kezdetben az Android-felhasználók gond nélkül letölthették a Doki Doki Irodalmi Klub!..

MA 19:45

A filléres napelemek titka: hibákból születő csúcshatékonyság

A vezető, ám helyigényes szilícium-napelemek piacán egy új versenytárs kezd feltörni: a különleges szerkezetű, hibákkal teli perovszkit-napelemek...

MA 19:34

Az európai repterek három héten belül kerozin nélkül maradhatnak

✈ Az európai repülőterek súlyos üzemanyaghiánnyal nézhetnek szembe három héten belül, ami jelentősen megzavarná a nyári utazási szezont és komoly károkat okozna a gazdaságnak...

MA 19:25

A szupravezetés hihetetlen visszatérése extrém mágneses térben

💥 Egy különleges fém, az urán-ditellurid (UTe2) egészen új oldalát mutatta meg a fizikusoknak, amikor nemrégiben váratlanul visszatért benne a szupravezetés szinte rekorderősségű mágneses terekben – pedig normál esetben ilyen körülmények között már rég megszűnne...

MA 19:02

Az emberi küzdelemnek vége a kibervédelemben?

Erre utal többek között az, hogy a legkomolyabb biztonsági rések egyre gyorsabban kerülnek a támadók kezébe, mint ahogy a védekezés képes lenne lépést tartani velük...

MA 18:56

Az MI-láz rekordbevételt hozott a TSMC-nek

A tajvani TSMC idei első negyedéves árbevétele elképesztő, 35%-os növekedést mutatott a januártól márciusig tartó időszakban, köszönhetően az MI-chipek iránti világméretű kereslet folyamatos emelkedésének...

MA 18:45

A legsebezhetőbbek az androidos kriptovaluta-alkalmazások

Mintegy 50 millió Androidos készülék volt veszélyben egy súlyos biztonsági hiba miatt, amelyet a Microsoft szakértői az EngageLab SDK-ban azonosítottak...

MA 18:34

Az Artemis II űrhajósai végre vízre szállnak – így nézheted a Netflixen

Az Orion űrhajó hősei, Victor Glover, Reid Wiseman, Christina Koch és Jeremy Hansen már hazafelé tartanak, és hamarosan a Csendes-óceánon hajtanak végre vízreszállást...

MA 18:23

A CPUID feltörése veszélybe sodorta a népszerű PC‑mérőket

⚠ Milliók által használt diagnosztikai programokat tettek használhatatlanná hackerek, akik a népszerű CPU-Z és HWMonitor hivatalos letöltési linkjeit módosították...

MA 17:35

Az otthoni sétapad tényleg csodaszer? Két modellt teszteltem

Az utóbbi években a sétapadok, más néven íróasztal alá helyezhető futópadok igazi wellness-sztárrá váltak...

MA 17:23

Az FBI iPhone-értesítésekből rakta össze a törölt Signal-üzeneteket

Ez a jelenség jól illusztrálható azzal, hogy a texasi ICE Prairieland Detention Facility-nél történt rongálás és petárdázás ügyében a hatóságok váratlan módszerrel jutottak hozzá kulcsfontosságú bizonyítékokhoz...

MA 17:02

Amikor a szülő tehetetlen: a Discord-támadások kegyetlen valósága

🙁 Brady Frey számára egy teljesen átlagos napnak indult, amikor egyszer csak kiderült, hogy tinédzser lánya Discord-fiókját feltörték...

MA 16:33

Az első baktériumdob: hallgasd, melyik kórokozó fertőzött meg!

🎵 Képzeld el, hogy nem mikroszkóppal lesed a bacikat, hanem meghallgatod őket!..

MA 16:23

Dél-Koreában alanyi jogon jár az alapszintű mobilnet

Dél-Korea úttörő lépést tett: mostantól minden mobil-előfizető számára elérhető az alapszintű internet-hozzáférés...

MA 16:12

Az Amazon aranyat érő MI-chipjein máris betelt a kapacitás

Egy lényeges szempont, hogy az Amazon vezetője, Andy Jassy friss éves levelében számos meglepő újdonsággal szolgált a felhőóriás háza tájáról...

MA 16:01

Az ősi versek felfedik a Nap titkos dühkitöréseit

🌞 Egy lényeges szempont, hogy évezredekkel ezelőtt a korabeli költők, például a japán nemes Fujiwara no Sadaie, olyan látványos égi jelenségeket jegyeztek fel, mint az északi fény...

MA 15:56

A semmiből születő részecskék: nem sci-fi, hanem valóság

Na most kapaszkodj, mert a tudósoknak végre sikerült kifaggatni az abszolút semmit, és kiderült: a tökéletes vákuum sem üres igazán...

MA 15:45

Az Amazon májusban lekapcsolja a régi Kindle-olvasókat

📖 Az Amazon bejelentette, hogy május 20-tól megszünteti a 2012 előtt megjelent Kindle e-könyv-olvasók támogatását...

MA 15:23

Az Anthropic ügynökei már helyetted is dolgozhatnak

Érdemes tudni, hogy a Claude fejlesztője, az Anthropic új szolgáltatást kínál azoknak a vállalkozásoknak, amelyek szeretnék automatizálni a napi feladatokat...

MA 15:12

Az iPhone már magától óv? Így aktiváld a biztonsági frissítést

Jó, hogy végre nem kell minden apróbb iOS-frissítésre ráizgulni – az Apple mostantól magától is dolgozik a háttérben!..

MA 15:02

Az asztali PC a végén jár? A Framework már temeti

A Framework április 21-én nagyszabású, Next Gen névre keresztelt eseményt tart, ennek apropóján a cég alapítója, Nirav Patel saját blogposztban fejtette ki a személyi számítógépek jövőjéről alkotott véleményét...