Nehézségekbe ütközött a mesterséges intelligencia, ezeken a fejtörőkön elbukott

Nehézségekbe ütközött a mesterséges intelligencia, ezeken a fejtörőkön elbukott
Vajon mennyire okos a mesterséges intelligencia? Bár a beszélgetések gördülékenysége, a szövegértés vagy a sakkbajnokságok sorozatos megnyerése már mind az MI oldalán áll, mégis akadnak olyan feladatok, amelyeket a legtöbb ember játékosan, másodpercek alatt megold – miközben a legfejlettebb algoritmusok is sorra elbuknak rajtuk. Fontos hangsúlyozni, hogy a mesterséges általános intelligencia, vagyis az AGI mércéje nem a bemagolt tudás vagy egyes speciális készségek, hanem az, hogy kevés információból képes-e a gép általánosítani és új helyzetekhez alkalmazkodni. Ez az a pont, ahol az MI jelenleg még messze elmarad embertársaink mögött.

Az absztrakció és logika próbája: a színes rácsok titka

A mesterséges intelligencia általánosító képességének mérésére dolgozta ki François Chollet 2019-ben az Absztrakció és Érvelés Korpuszt (Abstraction and Reasoning Corpus, röviden ARC), amely színes négyzetrácsokból felépülő apró logikai feladatok gyűjteménye. Ezeknél mindig fel kell ismerni egy rejtett szabályt, majd azt egy újszerű rácson alkalmazni. Az ARC rácspéldáit ma már szinte minden jelentős MI-rendszeren futtatják, a feladatcsomag iparági etalonná vált. Ezen kívül létrejött az ARC Prize Foundation is, amely nemcsak gondozza ezeket a teszteket, hanem rendszeresen fejleszt újakat is, például az ARC-AGI-2-t és most az ARC-AGI-3-at. Utóbbi újdonsága, hogy kifejezetten MI-ügynökök mérésére készült – videójátékokkal.

Mit is mér valójában az ARC?

Az ARC tesztje egyetlen minikészség elsajátítását várja el: minden feladat rávezet egy logikára, majd rögtön arra kér, hogy ezt az új tudást alkalmazzuk egy új helyzetben. Az MI tehát egy szűk területen tanul, és ez alapján próbál általánosítani. Mindezek ellenére ez még nem AGI – hiszen ilyen szűk tartományban maga az alkalmazkodás is erősen korlátos. Az ember ezzel szemben folyamatosan olyan feladatokat old meg (biciklizés, autóvezetés, nyelvtanulás), amelyek messze túlmutatnak a születéskori „tanító adathalmazon”.

Hol húzódik az AGI határa?

Akkor beszélhetünk valódi AGI-ról, ha elérkezik az a pillanat, amikor már nem találunk olyan problémát, amelyet az ember meg tud oldani, de az MI nem. Eddig azonban minden ilyen próbán elbukik az algoritmus: egy átlagember az ARC-feladatok jelentős részét sikerrel oldja meg, miközben a legokosabb MI, mint például a Grok, rendszerint csődöt mond. Fontos kiemelni, hogy ezek az MI-k már képesek mesterfokú vizsgákat, teszteket hibátlanul teljesíteni, de minden tudásuk szigetszerű, nincs meg bennük a mindennapi életben elengedhetetlen általánosítási képesség.


Az emberhez igazított nehézség

Az ARC-AGI-tesztcsomag legfőbb különlegessége, hogy minden egyes tesztet először emberek oldanak meg. A fejlesztők 400 önkéntest kértek fel, akik demográfiai szűrés után ugyanazt a feladatsort kapták számítógépen keresztül. Az átlagos eredmény az ARC-AGI-2-n 66 százalék körül volt, és egy kisebb csoport közös megoldásai összesen minden egyes kérdésre helyes választ adtak. Az MI-k jóval ez alatt teljesítenek.

Miért könnyű az embernek, és miért nehéz az MI-nek?

Az ember tanulása elképesztően hatékony: akár egyetlen példából is képesek vagyunk ráérezni a szabályra, majd alkalmazni azt új konfigurációkban. Ezzel szemben az MI algoritmusai (még a legmodernebbek is) nagyságrendekkel nehezebben tanulnak minta alapján; míg a gép száz vagy akár ezer példából sem találja meg azt, amire mi pillanatok alatt ráérzünk.

ARC-AGI-1-től a videojátékokig

Az első, eredeti ARC-AGI-1-et még 2019-ben alkotta meg Chollet; ez mintegy 1000 feladatból állt, amelyek több mint öt éven át leküzdhetetlen akadálynak bizonyultak az MI számára. Csak 2024-ben jelentek meg az OpenAI újabb modelljei, amelyek megközelítették ezt a mércét. Az ARC-AGI-2 komolyabb problémákat, nagyobb rácsokat és összetettebb szabályokat tartalmaz – amit az ember pár perc alatt megold, azt az MI gyakran meg sem közelíti. 2024-től teljesen új irányba is elmozdult a fejlesztés: az ARC-AGI-3 már interaktív, szimulációalapú próbákat tartalmaz.

Új mérce: ügynökteszt videojátékokban

A való élet ritkán „állapotmentes”: ott a döntéseink nem statikusak, hanem összefüggő sorozatot alkotnak. Egy igazi ügynöknek nemcsak egy kérdésre kell válaszolnia, hanem terveznie, tapasztalatból tanulnia, előre gondolkodnia is. Az ARC-AGI-3-hoz ezért 100 teljesen újszerű, kétdimenziós pixeles videojátékot hoztak létre. Minden játékban egy minikészség elsajátítása a cél: csak akkor lehet továbblépni, ha a játékos (legyen ember vagy MI) végigcsinálja a tervezett lépéssort, elsajátítja és helyesen alkalmazza az elvárt logikát. Az MI-k jelenlegi generációja egyelőre egyetlen pályát sem teljesített sikerrel.

MI megmérettetés videojátékban: miért más ez, mint eddig?

Videojátékokkal régóta tesztelik az MI fejlődését – az Atari-klasszikusok (Atari Classics) vagy a sakk, a Go például már lezárt terepnek számítanak. De ezeknél egyaránt gondot jelent, hogy nyilvánosan elérhető az összes szabály, rengeteg példa áll rendelkezésre, és számtalan MI-fejlesztő előzetes tudása is beépül a fejlesztésbe. Az új ARC-AGI-3 játékokkal mindez kizárható: nincs előzetes tudás, az MI-nek egy addig teljesen ismeretlen környezetben kell boldogulnia.

Következésképpen, bár az MI egyre okosabb, az általános alkalmazkodás és logikai problémamegoldás terén az ember még mindig magasan vezet – legalábbis, amíg a leggyorsabb algoritmus is hosszan gondolkodik azon, amin mi csak mosolygunk.

2025, adminboss, www.livescience.com alapján


Legfrissebb posztok

Véletlenül felfedezte a NASA az idegen üstököst, mielőtt kellett volna

MA 18:51

Véletlenül felfedezte a NASA az idegen üstököst, mielőtt kellett volna

A NASA egyik űrtávcsöve, a TESS, már két hónappal a hivatalos felfedezés előtt észrevette a ritka, naprendszeren túlról érkező 3I/ATLAS üstököst. Különösen fontos hangsúlyozni, hogy az akkor készült...

Az éghajlat a tomboló erdőtüzeink új főszereplője lett

MA 18:26

Az éghajlat a tomboló erdőtüzeink új főszereplője lett

2025 nyarán példátlan pusztítást okoztak az erdőtüzek Törökországban, Görögországban és Cipruson. A halálos lángok 20 áldozatot követeltek, 80 000 embert kényszerítettek otthonuk elhagyására, és több mint egymillió hektárnyi...

Tündérkörök alatt titkos hidrogénvagyon lapul

MA 18:02

Tündérkörök alatt titkos hidrogénvagyon lapul

🧙 Az energiaátmenet kulcsa lehet a mélyben rejtőző természetes hidrogén, ám nehéz megmondani, pontosan hol és milyen mélységben képződik belőle nagyobb mennyiség. Egy friss kutatás szerint azonban a rejtélyes...

Az új Samsung Galaxy S26 Edge olyan, mint egy iPhone?

MA 17:51

Az új Samsung Galaxy S26 Edge olyan, mint egy iPhone?

A Samsung Galaxy S26 Edge kiszivárgott képei alapján a telefon dizájnja kísértetiesen emlékeztet az iPhone 17 Pro-ra (iPhone 17 Pro). Az S26 Edge szinte teljesen keret nélküli kijelzővel...

Az új Ford F-150 Lightning STX besétál a porondra

MA 17:26

Az új Ford F-150 Lightning STX besétál a porondra

🚗 A Ford igyekszik megmenteni az F-150 Lightning eladási számait, amelyek idén csaknem 10%-kal csökkentek a tavalyi évhez képest. A villanyos pickup friss érdeklődést generálhat az új STX kivitel...

Az univerzum titka: miért létezünk egyáltalán?

MA 17:01

Az univerzum titka: miért létezünk egyáltalán?

🧠 Az univerzum létezése egyetlen, különös okra vezethető vissza: az anyag és az antianyag nem képesek békében megférni egymás mellett. A világegyetem születésekor jelentéktelennek tűnő, mégis végzetes aránytalanság alakult...

Az év napfogyatkozása: csak pingvinek és néhány szerencsés ember láthatja

MA 16:26

Az év napfogyatkozása: csak pingvinek és néhány szerencsés ember láthatja

🌌 Szeptember 21-én részleges napfogyatkozás lesz, amely szinte egybeesik a szeptember 22-i napéjegyenlőséggel. Míg az északi féltekén alig lehet majd észrevenni, az új-zélandiak, a Déli-sarkon telelő kutatók és rengeteg...

Az MI-val új trükkökkel jönnek, terjed a zsarolás és a csalás

MA 15:28

Az MI-val új trükkökkel jönnek, terjed a zsarolás és a csalás

Az MI fejlődése robbanásszerűen átalakította a kiberbűnözők módszereit és lehetőségeit. A legújabb vizsgálatok szerint ma már nemcsak tanácsadóként, hanem aktív „kiberfegyverként” vetik be az MI-t, így sokkal összetettebb...

Feltárult az első ismert fekete lyuk, a Világegyetem kezdetéről

MA 15:01

Feltárult az első ismert fekete lyuk, a Világegyetem kezdetéről

Egy nemzetközi csillagászcsapatnak, a Texasi Egyetem Cosmic Frontier Centerének vezetésével sikerült azonosítania a világegyetem eddig ismert legtávolabbi fekete lyukát. Ez a fekete lyuk és „otthona”, a CAPERS-LRD-z9 nevű...