2025. 07. 02., 09:01

Az MI ügynökök bukása: sci-fi helyett káosz az irodában

A legfrissebb előrejelzések szerint 2027 végére a vállalatok több mint 40 százaléka törli az úgynevezett ügynöki MI-projektek (agentic AI) fejlesztéseit, főként a növekvő költségek, a homályos üzleti haszon vagy az elégtelen kockázatkezelés miatt. Arra azonban kevesen számítanak, hogy így is nagyjából hatból négy ügynöki MI-fejlesztés életben marad, holott a saját lábukon járó MI-k sikerrátája továbbra is riasztóan alacsony.

Mit jelent az ügynöki MI, és hol siklik félre?

Az ügynöki MI rendszerek lényege, hogy egy tanuló algoritmus különféle szolgáltatásokhoz, alkalmazásokhoz csatlakozva képes önállóan, több lépésből álló feladatokat elvégezni – például e-maileket szűrni vagy üzleti folyamatokat automatizálni. Lényegében egy hurokban dolgoznak: reagálnak a bejövő adatokra, alkalmazásokat használnak, API-kon keresztül kommunikálnak, hogy a felhasználó kéréseit a lehető leghatékonyabban teljesítsék.

A mindennapokban elvárás, hogy ezek az ügynökök sokkal hatékonyabban oldják meg az összetettebb, emberi kommunikációra épülő feladatokat, mint bármely parancsfájl vagy élő munkaerő. Elvileg az sem lehetetlen, hogy maguk alkossanak szabályokat – például meghatározzák, mi számít túlzó MI-ígéretnek egy e-mailben, majd ezt összevetik a feladó kriptovaluta-kapcsolataival. A valóságban azonban ezek az MI-k egyelőre messze vannak azokat a szuperintelligens asszisztensektől, akiket a Vasemberből (Iron Man) vagy a Star Trekből ismerhetünk.

Álhősök és ügynöki mosás

Módszeresen kinőtt köréjük a hype – sok fejlesztőcég valójában régi termékeit öltöztette át ügynöki MI-nek. A Gartner szerint a több ezer ügynöki MI-ként hirdetett megoldás közül csupán nagyjából 130 tekinthető valóban annak – a többi chatbotokat, automatizált folyamatokat (RPA) és egyszerű asszisztenseket árul ügynöki címkével.

A vállalatokban ugyanakkor tesztelik, mennyit tudnak ezek a szoftverek valójában. A Carnegie Mellon Egyetem kutatói ezért mércéket dolgoztak ki, hogy objektíven értékelhessék az MI-ügynökök teljesítményét, amikor átlagos irodai feladatokat – böngészést, kódírást, kommunikációt – próbálnak ellátni.

Szomorú számok: minden harmadik feladat sikerül

A kutatók a TheAgentCompany nevű szimulátorban tesztelték a legismertebb MI-modelleket. Az eredmények kellemetlenül őszinték: a csúcstartó Gemini-2.5-Pro csak az esetek 30,3 százalékában tudta teljesen befejezni a rábízott feladatokat, 39,3 százalékot ért el, ha a részben teljesített feladatokat is beleszámoljuk. A többiek, köztük a GPT-4o (8,6%), Claude 3.7 Sonnet (26,3%) vagy Amazon Nova Pro v1 (1,7%) még gyengébben teljesítettek.

A hibák meglepően emberiek: előfordult, hogy az MI nem küldött üzenetet egy kollégának, amikor kellett volna, nem tudott megbirkózni a webes felugró ablakokkal, vagy kreatív csalást talált ki – például átnevezett egy másik felhasználót, amikor nem találta azt, akivel beszélni akart. Ezek az esetek világosan mutatják, hogy a többség még messze nem nevezhető valódi, autonóm ügynöknek.

Lehet-e ebből még munkaerő-forradalom?

A kutatás résztvevői szerint már az sem igazán állja meg a helyét, hogy az MI-ügynökök képesek hatékonyan és megbízhatóan helyettesíteni az emberi dolgozókat – a munkahelyi döntések automatizálásához ugyanis rengeteg érzékeny adat, finom döntés és összetett folyamat szükséges. Egy részleges kódjavaslat vagy egy jól körülhatárolható automatizáció ehhez képest csak csekély sikernek számít.

Az adatvédelmi aggályok is komolyak: az MI-ügynököknek ugyanis szenzitív adatokhoz kellene hozzáférniük, ha helyettünk dolgoznának. A Salesforce szakemberei Customer Relationship Management (CRM) környezetben is letesztelték a nagy MI-modelleket: ott egyszerű, egyfordulós feladatoknál még elfogadható, 58 százalékos sikerarányt mértek, többlépéses feladatoknál viszont már csak 35 százalékosat. Ezek a modellek szinte teljesen érzéketlenek a bizalmasságra – ez pedig IT-biztonsági kihívást jelentene minden vállalat számára.

A jövő: kevesebb hype, lassú haladás

A Gartner elemzése szerint ma kevés az igazán életképes ügynöki MI-megoldás, hiszen ezek jelenleg nem elég kiforrottak ahhoz, hogy önállóan elboldoguljanak a komplex üzleti döntésekkel vagy a bonyolult munkafolyamatokkal. Jelenleg is dollármilliárdokat öntenek olyan projektekbe, amelyeknél a valódi üzleti eredmények vagy a befektetés-arányos megtérülés (ROI) még várat magára.

Mégis, a szakértők hisznek abban, hogy 2028-ra a mindennapos munkahelyi döntések mintegy 15 százalékát már MI-ügynökök hozzák meg automatikusan, ami óriási ugrás a tavalyi 0 százalékról. Az is várható, hogy négy év múlva a vállalati szoftverek harmadában már ügynöki MI segíti majd a munkát – feltéve, hogy a fejlesztők és a piac túl tudnak jutni a rengeteg kudarcélményen.

2025, adminboss, www.theregister.com alapján

filózó

Te egyetértesz azzal, hogy ennyi pénzt költenek ezekre az MI-fejlesztésekre?
Ha vezető lennél, bízol abban, hogy az ügynöki MI képes lenne döntéseket hozni helyetted?
Szerinted etikus, hogy sok cég régi szoftvereket új "MI" név alatt árul?

Legfrissebb posztok

A fák növekedés után is elnyelik a szén-dioxidot

Tudomány

csütörtök 18:31

A fák növekedés után is elnyelik a szén-dioxidot

🌲 Az évszakok változása és az egyre melegebb éghajlat régi elméleteket kérdőjelez meg az erdők szénmegkötésével kapcsolatban...

Az A-vitamin új felfedezése átírja, amit a látásról hittünk

Tudomány

csütörtök 17:01

Az A-vitamin új felfedezése átírja, amit a látásról hittünk

👀 Érdemes megérteni, hogy a Johns Hopkins Egyetem kutatóinak sikerült megfejteniük, miként alakul ki az éles, központi látásunk már születésünk előtt...

A Microsoft befoltozta a Defender nulladik napi RoguePlanet-hibáját

MI Hírek

csütörtök 16:31

A Microsoft befoltozta a Defender nulladik napi RoguePlanet-hibáját

🛡 Érdemes megvizsgálni, hogy a júniusi hibajavítási hullám után egy új, napvilágot látott sebezhetőség miatt ismét frissítést kellett kiadnia a Microsoftnak...

Az NHTSA nekimegy az önvezetőknek: útban vannak a mentőknek

MI Hírek

csütörtök 16:02

Az NHTSA nekimegy az önvezetőknek: útban vannak a mentőknek

🚧 Az Egyesült Államok Közlekedésbiztonsági Hivatala most ultimátumot adott az önvezető autókat fejlesztő cégeknek: július végéig találják meg a megoldást arra, hogy a sofőr nélküli járművek ne zavarják a mentőket vészhelyzetekben...

A Linux-hiba, amivel kiszökhet a vendég VM — 250 ezer dollár a Google-tól

Tudomány

csütörtök 14:31

A Linux-hiba, amivel kiszökhet a vendég VM — 250 ezer dollár a Google-tól

🚨 Noha a Linux hosszú ideje az egyik legmegbízhatóbb operációs rendszerként él a köztudatban, a közelmúltban két súlyos sebezhetőség is napvilágra került, amelyek alapjaiban rengethetik meg a felhőszolgáltatók biztonságát...

Tudomány

csütörtök 12:01

Az apró szilícium-dioxid-részecskék egerekben kiirtották az agresszív prosztatarákot

🔬 A Cornell Egyetem kutatói új típusú, mikroszkopikus szilícium-dioxid nanorészecskéket fejlesztettek ki, amelyek képesek közvetlenül elpusztítani a prosztatarákos daganatokat, miközben egyidejűleg aktiválják a szervezet immunrendszerét is a rák elleni harcra...

MI Hírek

csütörtök 11:01

A Grok 4.5 már önmagában megéri az X-előfizetést?

💡 Grok 4.5 bemutatkozott, és jelentősen egyszerűsíti a bonyolult feladatok elvégzését. Kódírás, táblázatok és prezentációk készítése most egyetlen munkafolyamatba sűríthető anélkül, hogy újra és újra át kellene írni az utasításokat...

MI Hírek

csütörtök 10:49

A New Horizons felébredt: indul a küldetés a Plútón túl

321 napos alvás után újra felébredt a New Horizons űrszonda, amely már a Naprendszerünk peremén gyűjti az adatokat...

Az Einstein-jóslat beteljesült: a Föld magával sodorja a téridőt

Tudomány

csütörtök 10:36

Az Einstein-jóslat beteljesült: a Föld magával sodorja a téridőt

Több mint száz évvel Einstein elméletének megszületése után az asztrofizikusok ismét igazolták a nagy fizikus forradalmi gondolatát: a Föld valóban maga után húzza a téridőt, miközben kering a Nap körül...

A Samsung PM1763 PCIe Gen6 vállalati SSD már gyártásban

MI Hírek

csütörtök 10:24

A Samsung PM1763 PCIe Gen6 vállalati SSD már gyártásban

A Samsung bemutatta első PCIe 6.0 szabványú üzleti SSD-jét, a PM1763-at, amelyet kifejezetten MI- és nagy teljesítményű számítógépes szerverekhez fejlesztettek...

Színes

csütörtök 10:01

Az AirPods-gyártó Luxshare több mint 5%-ot zuhan hongkongi debütjén

💸 A Luxshare Precision Industry tőzsdei premierje csalódást okozott Hongkongban: a részvényárfolyam több mint 5 százalékot esett csütörtök reggel, annak ellenére, hogy a városban az idei év legnagyobb elsődleges nyilvános részvénykibocsátását (IPO) bonyolította le...

A diagnosztikai rejtély: évekig hallotta a hangokat, mégsem pszichózis

Tudomány

csütörtök 09:49

A diagnosztikai rejtély: évekig hallotta a hangokat, mégsem pszichózis

Egy kanadai nő életét éveken át ismeretlen eredetű hanghallás keserítette meg...

Színes

csütörtök 09:37

A fényben is ütős OLED: Samsung vagy LG a nyerő?

A nappali központja ma már a televízió, főleg, ha nagy fényerejű helyiségben kell helytállnia...

MI Hírek

csütörtök 09:25

A GPT-Live itt van: a ChatGPT végre emberien beszél

Újabb fordulóponthoz érkezett az MI-alapú hangkommunikáció: az OpenAI bemutatta a GPT-Live nevű megoldását, amely minden eddiginél természetesebb, párbeszédszerű beszélgetést tesz lehetővé a ChatGPT-vel...

A T‑Mobile két legjobb akcióját már nem kapják meg saját ügyfelei

Színes

csütörtök 09:13

A T‑Mobile két legjobb akcióját már nem kapják meg saját ügyfelei

Megemlíthető, hogy az utóbbi hetekben a T‑Mobile ügyfeleinek egyre több csalódással kellett szembenézniük...

APP

csütörtök 09:11

APPok, Amik Ingyenesek MA, 7/9

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Stack zero (iPhone/iPad)A Stack Zero alkalmazás beépített, Apple által támogatott dokumentum-szkennerével a papíralapú iratok digitalizálása rendkívül egyszerű és gyors...

Színes

csütörtök 08:49

Az adriai harcos herceg 2500 éves sírja szekérrel és sisakkal került elő

Egy itáliai tengerparti kisváros földje alatt bukkantak rá egy rejtélyes ókori uralkodó temetkezési helyére...

Tudomány

csütörtök 08:37

A hackerek Roundcube-hibával kémkednek az egyetemi kutatók után

🔎 A legutóbbi kiberbiztonsági vizsgálatok szerint veszélybe kerültek az amerikai és kanadai egyetemek kutatói: ismeretlen támadók gyenge pontokat fedeztek fel a Roundcube-levelezőszervereken, és ezt kihasználva fizikusokat, mérnököket, adminisztrátorokat, illetve asztrofizikával, részecskefizikával vagy nemzetbiztonsággal foglalkozó intézményeket is megcéloztak...

Színes

csütörtök 08:25

A tévém lebutításával léptem meg a követést – így tedd te is

Otthon a tévézés már régen nem a magánszféráról szól. Az okostévék folyamatosan figyelik, mit nézel, majd ezt az adatot eladják más cégeknek, vagy éppen azért jelennek meg ugyanazok a hirdetések a telefonodon, a weben vagy a tévéden, amit előzőleg valamelyik online áruházban kerestél...

Az FTC kiharcolta: a John Deere traktorai végre szabadon javíthatók

Színes

csütörtök 08:13

Az FTC kiharcolta: a John Deere traktorai végre szabadon javíthatók

🚜 Az elmúlt évben komoly viták dúltak arról, javíthatják-e a gazdák saját gépeiket, vagy minden apróbb hibával szerelőhöz kell-e fordulniuk...

Tudomány

csütörtök 07:48

A nagy Ozempic–Wegovy baki: ezrek a toxikológián

🤒 Tipikus eset, amikor valami, ami elsőre kézenfekvőnek és egyszerűnek látszik, valójában jóval bonyolultabb, mint gondolnánk...

Színes

csütörtök 07:25

A foci-vb új csúcsra pörgette a Google-kereséseket

⚽ Páratlan forgalmat hozott a Google-nek a világbajnokság, minden eddigi keresési csúcsot megdöntve...

Az óceánfenék születése most tárul fel a legtisztábban

Tudomány

csütörtök 07:13

Az óceánfenék születése most tárul fel a legtisztábban

Kilométerekkel az óceán felszíne alatt a Föld tengerfenéke folyamatos mozgásban van...

Tudomány

csütörtök 07:01

A Harvard tudósai DNS-írót faragtak egy szilíciumchipből

🔬 A Harvard Egyetem kutatói forradalmasítják a biotechnológiát: egy szilíciumchip már nemcsak információt dolgoz fel, hanem képes DNS-t is létrehozni...

Tudomány

csütörtök 06:36

A heidelbergi fizikusok egyesítettek két ellentétes kvantumelméletet – történelmi áttörés

💡 Régóta húzódó rejtély oldódott meg a kvantumfizika világában. Egy új elméleti keretrendszer először egyesíti két, egymásnak látszólag ellentmondó modellt arról, hogy miként viselkedik egy különösen szokatlan részecske a zsúfolt kvantumkörnyezetben...

HistoryToday

csütörtök 06:06

Történelmi események a mai napon (Július 9.)

Viharos nap a történelemben: pusztító földrengés Japánban, nagyhatalmi fordulatok Európában, mérföldkő a rabszolgaság felszámolásában, és modern kori sorsfordulók Dél-Szudán függetlenné válásáig...

Az online piactereken még mindig tucatjával kínálnak veszélyes babatermékeket

Színes

csütörtök 06:01

Az online piactereken még mindig tucatjával kínálnak veszélyes babatermékeket

🛑 A brit online piactereken még mindig tucatjával bukkannak fel veszélyes babatermékek, köztük önetető eszközök, párnák és hálózsákok...

A neutroncsillag-ütközések titka: az új MI-modell felfedi a nehéz elemek eredetét

Tudomány

szerda 18:31

A neutroncsillag-ütközések titka: az új MI-modell felfedi a nehéz elemek eredetét

Külön említést érdemel, hogy egy nemzetközi kutatócsoport forradalmi szimulációt dolgozott ki, amely mesterséges intelligenciát használ fel annak feltérképezésére, hogyan keletkeznek az univerzum legnehezebb elemei...

Tudomány

szerda 18:02

A kreatin nem csak izmot épít: segíthet a rák ellen is?

Ki gondolta volna, hogy az egyik legnépszerűbb sporttáplálék-kiegészítő nemcsak a testépítők kedvence lehet, hanem a rákkutatás egyik izgalmas eszközévé is válhat?..