2025. 09. 09., 09:03

Nehézségekbe ütközött a mesterséges intelligencia, ezeken a fejtörőkön elbukott

Nehézségekbe ütközött a mesterséges intelligencia, ezeken a fejtörőkön elbukott
Vajon mennyire okos a mesterséges intelligencia? Bár a beszélgetések gördülékenysége, a szövegértés vagy a sakkbajnokságok sorozatos megnyerése már mind az MI oldalán áll, mégis akadnak olyan feladatok, amelyeket a legtöbb ember játékosan, másodpercek alatt megold – miközben a legfejlettebb algoritmusok is sorra elbuknak rajtuk. Fontos hangsúlyozni, hogy a mesterséges általános intelligencia, vagyis az AGI mércéje nem a bemagolt tudás vagy egyes speciális készségek, hanem az, hogy kevés információból képes-e a gép általánosítani és új helyzetekhez alkalmazkodni. Ez az a pont, ahol az MI jelenleg még messze elmarad embertársaink mögött.

Az absztrakció és logika próbája: a színes rácsok titka

A mesterséges intelligencia általánosító képességének mérésére dolgozta ki François Chollet 2019-ben az Absztrakció és Érvelés Korpuszt (Abstraction and Reasoning Corpus, röviden ARC), amely színes négyzetrácsokból felépülő apró logikai feladatok gyűjteménye. Ezeknél mindig fel kell ismerni egy rejtett szabályt, majd azt egy újszerű rácson alkalmazni. Az ARC rácspéldáit ma már szinte minden jelentős MI-rendszeren futtatják, a feladatcsomag iparági etalonná vált. Ezen kívül létrejött az ARC Prize Foundation is, amely nemcsak gondozza ezeket a teszteket, hanem rendszeresen fejleszt újakat is, például az ARC-AGI-2-t és most az ARC-AGI-3-at. Utóbbi újdonsága, hogy kifejezetten MI-ügynökök mérésére készült – videójátékokkal.

Mit is mér valójában az ARC?

Az ARC tesztje egyetlen minikészség elsajátítását várja el: minden feladat rávezet egy logikára, majd rögtön arra kér, hogy ezt az új tudást alkalmazzuk egy új helyzetben. Az MI tehát egy szűk területen tanul, és ez alapján próbál általánosítani. Mindezek ellenére ez még nem AGI – hiszen ilyen szűk tartományban maga az alkalmazkodás is erősen korlátos. Az ember ezzel szemben folyamatosan olyan feladatokat old meg (biciklizés, autóvezetés, nyelvtanulás), amelyek messze túlmutatnak a születéskori „tanító adathalmazon”.

Hol húzódik az AGI határa?

Akkor beszélhetünk valódi AGI-ról, ha elérkezik az a pillanat, amikor már nem találunk olyan problémát, amelyet az ember meg tud oldani, de az MI nem. Eddig azonban minden ilyen próbán elbukik az algoritmus: egy átlagember az ARC-feladatok jelentős részét sikerrel oldja meg, miközben a legokosabb MI, mint például a Grok, rendszerint csődöt mond. Fontos kiemelni, hogy ezek az MI-k már képesek mesterfokú vizsgákat, teszteket hibátlanul teljesíteni, de minden tudásuk szigetszerű, nincs meg bennük a mindennapi életben elengedhetetlen általánosítási képesség.


Az emberhez igazított nehézség

Az ARC-AGI-tesztcsomag legfőbb különlegessége, hogy minden egyes tesztet először emberek oldanak meg. A fejlesztők 400 önkéntest kértek fel, akik demográfiai szűrés után ugyanazt a feladatsort kapták számítógépen keresztül. Az átlagos eredmény az ARC-AGI-2-n 66 százalék körül volt, és egy kisebb csoport közös megoldásai összesen minden egyes kérdésre helyes választ adtak. Az MI-k jóval ez alatt teljesítenek.

Miért könnyű az embernek, és miért nehéz az MI-nek?

Az ember tanulása elképesztően hatékony: akár egyetlen példából is képesek vagyunk ráérezni a szabályra, majd alkalmazni azt új konfigurációkban. Ezzel szemben az MI algoritmusai (még a legmodernebbek is) nagyságrendekkel nehezebben tanulnak minta alapján; míg a gép száz vagy akár ezer példából sem találja meg azt, amire mi pillanatok alatt ráérzünk.

ARC-AGI-1-től a videojátékokig

Az első, eredeti ARC-AGI-1-et még 2019-ben alkotta meg Chollet; ez mintegy 1000 feladatból állt, amelyek több mint öt éven át leküzdhetetlen akadálynak bizonyultak az MI számára. Csak 2024-ben jelentek meg az OpenAI újabb modelljei, amelyek megközelítették ezt a mércét. Az ARC-AGI-2 komolyabb problémákat, nagyobb rácsokat és összetettebb szabályokat tartalmaz – amit az ember pár perc alatt megold, azt az MI gyakran meg sem közelíti. 2024-től teljesen új irányba is elmozdult a fejlesztés: az ARC-AGI-3 már interaktív, szimulációalapú próbákat tartalmaz.

Új mérce: ügynökteszt videojátékokban

A való élet ritkán „állapotmentes”: ott a döntéseink nem statikusak, hanem összefüggő sorozatot alkotnak. Egy igazi ügynöknek nemcsak egy kérdésre kell válaszolnia, hanem terveznie, tapasztalatból tanulnia, előre gondolkodnia is. Az ARC-AGI-3-hoz ezért 100 teljesen újszerű, kétdimenziós pixeles videojátékot hoztak létre. Minden játékban egy minikészség elsajátítása a cél: csak akkor lehet továbblépni, ha a játékos (legyen ember vagy MI) végigcsinálja a tervezett lépéssort, elsajátítja és helyesen alkalmazza az elvárt logikát. Az MI-k jelenlegi generációja egyelőre egyetlen pályát sem teljesített sikerrel.

MI megmérettetés videojátékban: miért más ez, mint eddig?

Videojátékokkal régóta tesztelik az MI fejlődését – az Atari-klasszikusok (Atari Classics) vagy a sakk, a Go például már lezárt terepnek számítanak. De ezeknél egyaránt gondot jelent, hogy nyilvánosan elérhető az összes szabály, rengeteg példa áll rendelkezésre, és számtalan MI-fejlesztő előzetes tudása is beépül a fejlesztésbe. Az új ARC-AGI-3 játékokkal mindez kizárható: nincs előzetes tudás, az MI-nek egy addig teljesen ismeretlen környezetben kell boldogulnia.

Következésképpen, bár az MI egyre okosabb, az általános alkalmazkodás és logikai problémamegoldás terén az ember még mindig magasan vezet – legalábbis, amíg a leggyorsabb algoritmus is hosszan gondolkodik azon, amin mi csak mosolygunk.

2025, adminboss, www.livescience.com alapján

Legfrissebb posztok

MA 18:37

A mesterséges lélek kézikönyve: Claude 80 oldalas személyisége

Claude, az Anthropic által fejlesztett MI-chatbot, egy különleges, 80 oldalas „lélekkel” rendelkezik, amely meghatározza a személyiségét és alapvető szabályait...

MA 18:03

Az európai MI már a GitHub Copilot trónjára pályázik

Kezdetben az amerikai technológiai óriások játszották a főszerepet a mesterséges intelligencia által támogatott kódolás piacán, de most új európai rivális lépett színre...

MA 17:55

A legendás Számítógép-történeti Múzeum beköltözött az online térbe

A kaliforniai Mountain View-ban található Számítógép-történeti Múzeum mostantól virtuálisan is látogatható, így már nem kell Amerikáig utazni ahhoz, hogy valaki belemerüljön a digitális kor legfontosabb ereklyéi közé...

MA 17:37

Az Uber beszáll a robotaxi-versenybe: 25 ezer önvezető autót ígér

A torontói Waabi eddig önvezető kamionokra specializálódott, most azonban a robotaxi-piacra lép be, méghozzá az Uberrel közösen...

MA 17:19

Az MI-forradalom: ingyenes képzés minden brit dolgozónak

Az Egyesült Királyság kormánya ingyenes online MI-képzéseket indított, hogy felkészítse a munkavállalókat az MI használatára a munkahelyeken...

MA 16:57

Az új GnuPG-frissítés kritikus biztonsági rést tár fel

⚠ Érdemes megvizsgálni, milyen veszélyeket rejt a GnuPG legújabb hibája, amelyhez frissítés is érkezett...

MA 16:37

Az új WhatsApp‑zár páncélként védi a veszélyeztetetteket

A Meta elindította a WhatsApp teljesen új védelmi funkcióját, amely mostantól fokozott biztonságot kínál újságírók, közszereplők és más, komoly fenyegetettségnek kitett felhasználók számára...

MA 16:19

A mesterséges intelligencia 800 rejtélyes kozmikus anomáliát fedezett fel

A Hubble-űrteleszkóp több mint százmillió képének gyors elemzésére vetették be az Európai Űrügynökség (ESA) tudósai által fejlesztett MI-t, amely két és fél nap alatt 800 korábban ismeretlen kozmikus anomáliát fedezett fel...

MA 16:02

Az iPhone 18 Pro lenyomhatja a Galaxy-t a zoomcsatában

Egyre biztosabbnak tűnik, hogy az Apple rövid időn belül különleges teleobjektív-előtétet tesztel az iPhone 18 Pro modelleken...

MA 15:38

A világ első robotarca, amely úgy mozgatja ajkát, mint egy ember

😃 Felmerül a kérdés, hogy vajon meg tudod-e különböztetni a robotot az embertől beszéd közben — lehet, hogy hamarosan már nem lesz ilyen egyszerű...

MA 15:19

Az MI feltárta a Hubble rejtélyeit: 1400 új objektum

Két európai csillagász, David O’Ryan és Pablo Gómez, az Európai Űrügynökség kutatói, közel 800 eddig ismeretlen asztrofizikai anomáliát bányásztak elő a Hubble-űrtávcső harmincöt éves adatgyűjteményéből...

MA 15:01

A japán óriás betörne az amerikai kriptobankok elit klubjába

A japán Nomura pénzügyi csoport digitális leányvállalata, a Laser Digital engedélyért folyamodott az Egyesült Államokban, hogy létrehozzon egy nemzeti trustbankot, amely intézményi ügyfeleknek nyújtana kriptovaluták kezelésével kapcsolatos szolgáltatásokat...

MA 14:55

Az első NVIDIA H200 MI-chipek végre megérkezhetnek Kínába

🚀 Kína hosszú huzavona után jóváhagyta az NVIDIA H200 MI-GPU-k első nagyobb szállítmányának importját, miután a kormány korábban elutasította azt...

MA 14:37

A WhatsApp szuperbiztonsági módja végre egy kattintással bekapcsolható

🔒 A WhatsApp mostantól egyetlen gombnyomással bekapcsolható szigorú adatvédelmi módot kínál, amellyel mindenki gyorsan fokozhatja a saját védelmét...

MA 14:19

Újabb leépítés: az Amazon 16 ezer embert bocsát el

🙁 Az Amazon újabb 16 000 munkavállalót bocsát el világszerte, hogy átalakítsa és egyszerűsítse működését...

MA 14:02

Az áttörés előtt áll Ázsiában a zöld repülőüzemanyag

🛫 Szingapúr Tuas ipari negyedében található a világ legnagyobb fenntartható repülőüzemanyag (SAF) finomítója, ahol használt étolajból és állati zsírból állítanak elő repülőgépeket hajtó üzemanyagot...

MA 13:55

Az ősi marsi tengerpart végre kiteregeti a titkait

A NASA Perseverance marsjárójának friss felfedezései gyökeresen megváltoztatják, mit gondolunk a Mars múltbeli lakhatóságáról...

MA 13:38

Az iskolai étkeztetés lehet a gyermekszegénység elleni áttörés

🍳 A 2026-os év rögtön az elején komoly kihívásokat hozott a globális éhezés kezelése terén...

MA 13:20

Az amerikai dollár zuhan: újra négyéves mélyponton

Az amerikai dollár 2022 februárja óta nem látott mélypontra zuhant, miután Donald Trump elnök ismét nyíltan elbagatellizálta a valuta gyengülése miatti aggodalmakat...

MA 13:01

A barlangi medve visszavág: véres véget ér az ősi vadászat

Egy 27 000 évvel ezelőtt élt tinédzser csontvázának vizsgálata ritka bepillantást enged az őskori mindennapok brutalitásába...

MA 12:56

A homárok MI-asszisztense: minden, amit a Moltbotról tudni kell

Az internet új kedvence nem más, mint egy digitális homár: a Moltbot, a személyi MI-asszisztens, amelynek fő attrakciója, hogy ténylegesen elvégzi helyettünk a feladatokat...

MA 12:37

Az SK Hynix beszáll az amerikai MI-lázba

🚀 Dél-koreai memóriagyártó óriás, az SK Hynix legalább 3 700 milliárd forintot fordít egy új, mesterséges intelligenciára specializálódó amerikai vállalat létrehozására...

MA 12:21

Az Android-frissítések dzsungele: így találsz ki a verziók útvesztőjéből

Az Android világában a frissítések sosem haladnak egyenes úton. Mindenki hallott már arról, hogy új funkciók jelentek meg, amelyeket a telefonján még nem talál, vagy éppen azt látja, hogy hónapokkal a hivatalos bejelentés előtt már valakik beszélnek róluk...

MA 12:02

Az élő gyöngysor réme: új pókparazita Brazíliában

Egy apró pók furcsa gyöngysorral a testén igazi tudományos szenzációvá vált a São Pauló-i Butantan Intézet Zoológiai Gyűjteményében...

MA 11:56

Az ökogazdaságban most a profit írja a szabályokat

Évtizedeken át az organikus gazdálkodás témája elsősorban a fenntarthatóságról, a környezeti egészségről és az állatjólétről szólt...

MA 11:37

Az MI-láz megduplázta az SK Hynix nyereségét

A dél-koreai SK Hynix történelmi rekordokat döntött 2025-ben: a vállalat éves árbevétele közel 50%-kal, üzemi nyeresége pedig több mint duplájára nőtt az előző évhez képest...

MA 11:19

A vadáfonya, a szupersztár: a szív és az agy őre

🍒 Különösen igaz ez akkor, ha valaki egészségesebb keringést, jobb anyagcserét vagy erősebb memóriát szeretne: egyre több tudományos bizonyíték utal arra, hogy a vadáfonya fogyasztása valódi csodafegyver lehet a szív, az emésztőrendszer és az agy védelmében...

MA 11:02

A Holdba csapódhat egy aszteroida – aranybánya vagy katasztrófa?

🌕 2032 végén egy 60 méter átmérőjű aszteroida, a 2024 YR4 nevű kisbolygó akár a Holdba is csapódhat...

MA 10:57

Az Adobe Photoshop MI-újításokkal hódítja meg a kreatívokat

Az Adobe Photoshop ma jelentős frissítéseket kapott, amelyek a Firefly generatív MI-technológiájára épülnek...