
Mit tud a ChatGPT ügynök?
Az új MI nemcsak adatokat keres, hanem azok alapján cselekszik is. Tegyük fel, hogy szeretnéd, ha átnézné a naptáradat, összefoglalná a közelgő eseményeket, vagy rövid prezentációt készítene egy adatcsomag alapján – mindezt már megoldja. Még arra is képes, hogy egy japán reggeli hozzávalóit ne csak felsorolja, hanem meg is vásárolja azokat online (például tíz főre). Lényeges szempont, hogy a ChatGPT ügynök ezzel komplex, valós életbeli feladatokat képes végrehajtani, amelyeket elődei még nem tudtak kezelni.
Mindezek dacára akadnak kiaknázatlan területek – például a térbeli tájékozódás, útvonaltervezés terén jóval gyengébben teljesít. Hiányzik belőle a tartós emlékezet is: nem képes több interakció között következetesen emlékezni a korábbi információkra.
Kipróbált teljesítmény, összehasonlítások
Az OpenAI szerint a ChatGPT ügynök a tesztek során lényegesen pontosabb volt, mint elődei: egy szakmai kérdéseket tartalmazó teszten (MMLU) 41,6%-os pontosságot ért el a régi modellek 20,3%-ához képest. A világ legnehezebb matematikai tesztjén, a Határmatematika (FrontierMath) teszten is nagy fölénnyel verte saját korábbi verzióit és más OpenAI eszközöket. Ez a fejlettség három pilléren nyugszik: a saját böngészővel rendelkező Operator ügynökön, a deep research (mély kutatás) tömeges adatfeldolgozón, valamint a csevegőalapú ChatGPT elődein.
Ma már önállóan képes böngészni, kódot írni, fájlokat létrehozni és kezelni – persze még mindig igényel emberi felügyeletet. Nyarko, a Morgan State Egyetem professzora ugyanakkor hangsúlyozza, hogy nem szabad teljesen magára hagyni: könnyen hibázhat, téves következtetéseket vonhat le, és szükséges a beépített védelmi mechanizmusok alkalmazása.
Veszélyek, biztonsági aggályok
Az OpenAI maga is elismeri, hogy a ChatGPT ügynök biológiai és vegyi képességei magasak – ezzel akár veszélyes anyagok előállításában is segédkezhet, ha rossz kezekbe kerül. Egy MI által végzett kutatás könnyedén összekötheti a tudományos diszciplínák eredményeit, szakértői magyarázatokkal és jelentős gyorsasággal. Virtuális számítógépe révén a fájlokat, weboldalakat, űrlapokat is önállóan kezeli, ami tovább növeli a lehetséges kockázatokat adatlopás, pénzügyi csalás vagy rendszerek eltérítése terén.
Mindezeken túl új dilemma, hogy az MI ügynökök tovább erősíthetik a hibákat, torzításokat terjeszthetnek, komplexebbé teszik a felelősség kérdését, és akár pszichológiai függőséget is kialakíthatnak.
Miként reagál az OpenAI?
Az MI fokozott veszélyei miatt már számos védelmi eljárást vezettek be: kockázatelemzés, kettős felhasználás elutasításának tréningje, hibafeltáró (bug bounty) programok és szakértői biztonsági támadások (red-teaming), főként biológiai védelmi célokra. Ebből kifolyólag, bár a cég javuló óvintézkedéseket ígér, egy 2025-ös biztonsági elemzés szerint csak 33%-os pontszámot ért el a veszélykockázat-menedzsmentben, sőt, összesítésben is csak közepes (C) minősítést kapott a Jövő Élet Intézete (Future of Life Institute) értékelése alapján.
Az MI kétségkívül hegyeket tud megmozgatni, de kérdés, elbírjuk-e a hegymozgatás veszélyeit is.