Mostantól az MI végzi helyettünk a munkát, de biztosan ezt akarjuk?

Az OpenAI új fejlesztése, a ChatGPT ügynök jelentősen kibővíti a mesterséges intelligencia lehetőségeit: a virtuális számítógép és a beépített eszköztár révén most már nemcsak elemzéseket és adatgyűjtést tud végezni, hanem konkrét feladatokat is képes elvégezni a számítógépeden. Ez az újítás lényegesen összetettebb, többlépcsős munkafolyamatokat is képes megvalósítani emberi felügyelet mellett, amelyekről eddig az MI még csak nem is álmodott.

Mit tud a ChatGPT ügynök?

Az új MI nemcsak adatokat keres, hanem azok alapján cselekszik is. Tegyük fel, hogy szeretnéd, ha átnézné a naptáradat, összefoglalná a közelgő eseményeket, vagy rövid prezentációt készítene egy adatcsomag alapján – mindezt már megoldja. Még arra is képes, hogy egy japán reggeli hozzávalóit ne csak felsorolja, hanem meg is vásárolja azokat online (például tíz főre). Lényeges szempont, hogy a ChatGPT ügynök ezzel komplex, valós életbeli feladatokat képes végrehajtani, amelyeket elődei még nem tudtak kezelni.

Mindezek dacára akadnak kiaknázatlan területek – például a térbeli tájékozódás, útvonaltervezés terén jóval gyengébben teljesít. Hiányzik belőle a tartós emlékezet is: nem képes több interakció között következetesen emlékezni a korábbi információkra.

Kipróbált teljesítmény, összehasonlítások

Az OpenAI szerint a ChatGPT ügynök a tesztek során lényegesen pontosabb volt, mint elődei: egy szakmai kérdéseket tartalmazó teszten (MMLU) 41,6%-os pontosságot ért el a régi modellek 20,3%-ához képest. A világ legnehezebb matematikai tesztjén, a Határmatematika (FrontierMath) teszten is nagy fölénnyel verte saját korábbi verzióit és más OpenAI eszközöket. Ez a fejlettség három pilléren nyugszik: a saját böngészővel rendelkező Operator ügynökön, a deep research (mély kutatás) tömeges adatfeldolgozón, valamint a csevegőalapú ChatGPT elődein.

Ma már önállóan képes böngészni, kódot írni, fájlokat létrehozni és kezelni – persze még mindig igényel emberi felügyeletet. Nyarko, a Morgan State Egyetem professzora ugyanakkor hangsúlyozza, hogy nem szabad teljesen magára hagyni: könnyen hibázhat, téves következtetéseket vonhat le, és szükséges a beépített védelmi mechanizmusok alkalmazása.

Veszélyek, biztonsági aggályok

Az OpenAI maga is elismeri, hogy a ChatGPT ügynök biológiai és vegyi képességei magasak – ezzel akár veszélyes anyagok előállításában is segédkezhet, ha rossz kezekbe kerül. Egy MI által végzett kutatás könnyedén összekötheti a tudományos diszciplínák eredményeit, szakértői magyarázatokkal és jelentős gyorsasággal. Virtuális számítógépe révén a fájlokat, weboldalakat, űrlapokat is önállóan kezeli, ami tovább növeli a lehetséges kockázatokat adatlopás, pénzügyi csalás vagy rendszerek eltérítése terén.

Mindezeken túl új dilemma, hogy az MI ügynökök tovább erősíthetik a hibákat, torzításokat terjeszthetnek, komplexebbé teszik a felelősség kérdését, és akár pszichológiai függőséget is kialakíthatnak.

Miként reagál az OpenAI?

Az MI fokozott veszélyei miatt már számos védelmi eljárást vezettek be: kockázatelemzés, kettős felhasználás elutasításának tréningje, hibafeltáró (bug bounty) programok és szakértői biztonsági támadások (red-teaming), főként biológiai védelmi célokra. Ebből kifolyólag, bár a cég javuló óvintézkedéseket ígér, egy 2025-ös biztonsági elemzés szerint csak 33%-os pontszámot ért el a veszélykockázat-menedzsmentben, sőt, összesítésben is csak közepes (C) minősítést kapott a Jövő Élet Intézete (Future of Life Institute) értékelése alapján.

Az MI kétségkívül hegyeket tud megmozgatni, de kérdés, elbírjuk-e a hegymozgatás veszélyeit is.

2025, adminboss, www.livescience.com alapján