
Zavar a definíció körül
Nehéz általánosan elfogadott meghatározást adni az AGI-ra, mégis kevesen hajlandóak ezt elismerni, főleg, ha jelentős tőke forog kockán. Az utóbbi években techóriások vezetői egyre többször beszélnek arról, hogy az AGI már a küszöbön van – de éppen arról nincs egyezség, hogy micsoda is valójában. Ha száz MI-szakértőt kérdezel, százféle definíciót kapsz.
Ez már rég nem csak elméleti játék. A bizonytalanság, hogy mit nevezünk AGI-nak, befolyásolja a fejlesztési irányokat, a szabályozást, sőt, még a befektetési döntéseket is. Mit állít pontosan egy cég, amikor azt mondja: hamarosan elérjük az AGI-t?
Emberi szint? Milyen emberi?
Az AGI definíciója általában azt jelenti, hogy az MI képes ismeretlen feladatokat is megoldani, általánosítani korábbi tudását, sőt, felvenni a versenyt az emberrel bármilyen területen. De mit jelent pontosan a “humán szint”? Egy átlagember, egy specialista vagy egy Nobel-díjas mércéje az alap? Milyen feladatok számítanak bele? Hiszen nincs olyan ember, aki minden területen csúcsteljesítményt nyújtana. Ráadásul az is kérdéses, kell-e egyáltalán, hogy az MI az embert másolja, vagy lehetnek egészen más erősségei, illetve gyengeségei.
Vándorló célkereszt: AGI a történelemben
Az AGI fogalma viszonylag új: csak a 90-es évek végén használta először Mark Gubrud, igazán elterjedtté azonban csak 2000 után vált. Az 1960-as években az volt a jóslat, hogy húsz éven belül a gépek “bármit el tudnak végezni”, amit az ember. Ahogy azonban a robotika lemaradt a szoftverek fejlődésétől, a lécet rendre lejjebb vitték: előbb az “emberi szintű” teljesítmény, majd a “gazdaságilag hasznos” feladatok jelentek meg mérceként, ma pedig már egészen homályos kritériumok uralkodnak.
Alan Turing által javasolt Turing-teszt hosszú évtizedekig volt az MI intelligenciájának etalonja: ha egy gép képes megtéveszteni egy embert, elég “emberi”. De ma a modern nyelvi modellek részletes beszélgetéseket folytatnak anélkül, hogy bármiben “gondolkodnának”, mint az ember. Ez is mutatja, mennyit változott a mérce.
Profit, spirituális mámor és elutasítás
Ma az AGI definíciója cégenként teljesen eltérő. Az OpenAI csúcsvezetése például úgy írja le, mint azokat az MI-rendszereket, amelyek a legtöbb gazdaságilag értékes munkában felülmúlják az embert. Sam Altman szerint a cégük már tudja, hogyan kell ilyen AGI-t építeni. Eközben volt főkutatójukról azt beszélik, hogy AGI-értékű spirituális mítoszt gyártott a munkatársak között. Mark Zuckerbergnek nincs rövid, frappáns definíciója, az Anthropic vezére, Dario Amodei szerint pedig az AGI túl általános és túl van terhelve sci-fi elvárásokkal. Ő inkább a “nagy teljesítményű MI” vagy “szakértői tudománymérnöki MI” kifejezést használja.
A Google DeepMind próbálkozott rendrakással: öt szintet vezetett be az AGI-teljesítmény mérésére, az “emerging” (kezdő) szinttől a “superhuman”-ig (emberfeletti). Szerintük ma a legerősebb MI-k is csak a kezdő AGI szintjén vannak, vagyis legfeljebb egy rutintalan ember szintjén teljesítenek különféle feladatokban.
Jog, profit és filozófia ütközése
A Microsoft és az OpenAI közötti kapcsolat is rámutat a zűrzavarra: 13 milliárd dolláros partnerségük szerződésében a Microsoft hozzáférését az AGI-hoz kötötték – ma azonban már nem tudnak megegyezni abban, hogy honnan számít valami AGI-nak. Az a híres 100 milliárd dolláros (37 ezermilliárd forintos) profitmérce is azt sugallja, hogy a pénzügyi siker az intelligencia fő mutatója – mintha egy bankautomatát okosabbnak neveznénk nálad, mert több pénzt keres.
A helyzet ijesztő: attól függően, hogyan definiáljuk az AGI-t, lehet, hogy már most elértük – vagy hogy sosem lesz lehetséges. Ez csak tovább nehezíti a kommunikációt és a fejlesztési irányokat.
Miért nincsenek jó mércék?
A Turing-tesztnek számos alternatívája született, mint például az Absztrakciós és Következtetési Korpusz (Abstraction and Reasoning Corpus, ARC), amely az MI-k új, vizuális problémamegoldó képességét méri. Viszont sok teszt csak azt méri, mennyire tud jól az MI “megjegyezni” előre látott adatokat. A valódi intelligencia azonban nem pusztán adatmásolás. Ráadásul még a legkifinomultabb tesztek is próbálják az intelligenciát egyetlen pontszámra redukálni – ami olyan, mintha az emberi zsenialitást centiméterben próbálnánk mérni. Mivel nincs teljes definíciónk az emberi intelligenciáról, így a mesterséges intelligenciát is csak töredékesen tudjuk tesztelni.
AGI közel? Nem mindenki hiszi el…
Bár az MI-ben óriási előrelépések történtek, a legtöbb kutató kételkedik abban, hogy valóban a küszöbön állunk. Egy 2024-es nemzetközi MI-kutatói felmérés szerint a válaszadók 76%-a úgy gondolja, hogy a jelenlegi megközelítések “valószínűtlenül” vagy “nagyon valószínűtlenül” vezetnek AGI-hoz. Más kutatók azt látják, hogy folyamatosan alábecsülik a fejlődés ütemét: egyes mérföldköveket évek helyett hónapok alatt sikerült elérni.
Ezzel együtt az egyik legismertebb MI-podcast házigazdája, Dwarkesh Patel most inkább hét évre saccolja, hogy eljutunk az ember-szerűen alkalmazkodó, folyamatosan tanuló MI-hez – szerinte jelenleg még komoly akadályai vannak annak, hogy az MI “munkában tanuljon”.
Miért (lenne) fontos a tiszta definíció?
A definíció hiánya nem pusztán akadémiai vita: a cégek és politikusok is ezekre hivatkozva hoznak döntéseket, írnak szerződéseket, hoznak szabályokat. Befektetéseket, munkahelyeket, társadalmi várakozásokat is befolyásol a ködösítés. Ha nincs pontos mérce, mindenki másképp értelmezi az AGI-t, így a szakmai diskurzus félremegy, a közönség pedig – akár alaptalanul – túlzott elvárásokat támaszt az MI-vel szemben.
Lehet, el kellene engedni az AGI kifejezést, és inkább konkrét képességeket mérni: képes-e újat tanulni átprogramozás nélkül, meg tudja-e magyarázni döntéseit, veszélytelenül, átláthatóan működik-e? Ha ezekre a kérdésekre tudnánk válaszolni, sokkal többet megtudnánk az MI valódi előrehaladásáról, mint bármelyik hangzatos, de üres AGI-cél felé rohanva. Az MI fejlődése inkább többrétű spektrum, semmint egyetlen ugrásszerű áttörés – de egy használható, objektív “intelligencia” definíciótól még nagyon messze vagyunk.