Régi világtérképekkel hódít újra a mesterséges intelligencia

Régi világtérképekkel hódít újra a mesterséges intelligencia
Az emberi gondolkodás a világ működéséről alkotott belső modelleken alapul: tudjuk, hogy nem lépünk a sínekre, amikor jön a vonat, még ha sosem próbáltuk ki ennek következményeit. Érdemes kiemelni, hogy a legújabb MI-kutatások – főként az általános mesterséges intelligencia (AGI) irányába tartók – egyre inkább azt vallják, hogy gépeinknek is kellene valami hasonlót tudniuk. A világmodell, vagyis a külvilágról alkotott belső reprezentáció már régóta nem újdonság: a pszichológiában, robotikában és gépi tanulásban évtizedek óta jelen van, most azonban ismét a figyelem középpontjába került.

A világmodell gyökerei: egy elfeledett skót pszichológus nyomán

A fogalom gyökerei egészen 1943-ig nyúlnak vissza, amikor Kenneth Craik, egy skót pszichológus felvetette: ha egy szervezet fejében ott van egy kicsinyített modell a valóságról, akkor jobban, gyorsabban és biztonságosabban tud dönteni, gondolkodni, cselekedni. A számítástechnikai korszak hajnalán a Craik által megálmodott mentális modellek akkor váltak igazán fontossá, amikor a kognitív tudomány és az MI összekapcsolódott. A hetvenes évek MI-pionírjai például a blokkok világa (blocks world) egyszerűsített világmodelljével próbáltak absztrakt következtetésekhez és elemzési képességhez jutni.

Ezzel szemben a túl bonyolult, kézzel készített modellek gyorsan elavultak; Rodney Brooks MI-kutató például végül teljesen elvetette őket a ’80-as évek végére, mondván: a világ önmagának a legjobb modellje – a mesterséges absztrakciók csak gátolják a hatékonyságot.

A deep learning forradalma: szabályok helyett tapasztalati tudás

A fordulatot a gépi tanulás, főként a mesterséges neurális hálózatok hozták: ezek képesek voltak saját környezetükről belső közelítéseket kialakítani, kézzel írt szabályok nélkül. Így már lehetséges volt például egy virtuális versenyautó vezetése, vagy éppen chatbotok, mint a ChatGPT létrehozása, amelyek számtalan hétköznapi láncolatot „látnak előre”. Ahogy ezek a nyelvi modellek egyre váratlanabb, szakterületen kívüli feladatokat is meg tudtak oldani, sok kutató (például Geoffrey Hinton, Ilya Sutskever és Chris Olah) feltételezte, hogy ezekben az MI-kben valahol megbújnak a Craik nevéhez fűződő mini-világmodellek.

Káosz és szabályrendszerek: van-e tényleg belső világtérkép?

Ez alapján arra lehet következtetni, hogy ezek a nagy és bonyolult MI-k valójában nem átfogó világmodellekkel, hanem inkább elszigetelt, gyakran egymásnak ellentmondó heurisztikák gyűjteményével dolgoznak. Ez a vak emberek és az elefánt történetére emlékeztet: aki a farkát fogja, kötelet gondol, aki a lábát, facsonkra tippel. Amikor például egy nagy nyelvi modellből próbálnak konzisztensebb játékmodelleket előcsalni – mondjuk egy Othello-tábla egészének digitális ábrázolását – rendre csak részleteket találnak: egy kis kígyót, egy kis fát, egy kis kötelet, de az egész elefánt, azaz a teljes kép hiányzik.

Mindez azonban nem teszi értéktelenné ezeket a rendszereket. Képesek például szinte tökéletes navigációs útmutatást adni Manhattanben két pont között – anélkül, hogy valós, átfogó térképet alkotnának a városról. Amint azonban a kutatók véletlenszerűen elzártak 1%-nyi utcát Manhattanből, a MI teljesítménye összeomlott. Ha világmodell állt volna mögötte, nem okozott volna gondot az akadályok megkerülése.


A valódi világmodellek jelentősége és a jövő kihívásai

Ennek fényében nem csoda, hogy a legnagyobb MI-laborok világszerte saját világmodelleken dolgoznak, és a kutatók is egyre nagyobb lendülettel merülnek el a kérdésben. Egy igazán robusztus, ellenőrizhető világmodell nemcsak az AGI szent grálját jelentheti, hanem megbízhatóbb, átláthatóbb és értelmesebb döntéshozatalt, valamint a MI által generált „hallucinációk” csökkentését is ígéri.

Azt viszont továbbra sem tudja senki, hogyan lehet ezt a célt a leggyorsabban elérni. A Google DeepMind és az OpenAI a multimodális, azaz szövegen túl videókat, szimulációkat, 3D adatokat is használó tréningekben hisz; a Meta kutatója, Yann LeCun szerint viszont teljesen új, nem generatív MI-architektúra szükséges. A közös cél: a világ belső digitális hókristálygömbjének – egy modellezhető, átfogó valóságképnek – megtalálása. Hogy mindebből valaha sikerül-e használható MI-t alkotni? Egyelőre csak remélhetjük, hogy a valódi elefántot fejlesztjük, nem csak újabb köteleket, fákat és kígyókat.

2025, adminboss, www.quantamagazine.org alapján

  • Mit gondolsz, egy MI-nek mindig kell-e használnia belső világmodellt?
  • Szerinted etikus lenne, ha a gépek maguk dönthetnének a világról szóló modelljeikkel?
  • Mit tettél volna akkor, ha azt látod, hogy egy rendszer rossz következtetésre jut a részleges tudása miatt?



Legfrissebb posztok

Az Atlanti-óceán áramlása leállhat, veszélyben a klíma

MA 18:51

Az Atlanti-óceán áramlása leállhat, veszélyben a klíma

A szakértők egyre nagyobb aggodalommal figyelik az Atlanti Meridionális Áramlási Cirkuláció (AMOC) sorsát, amely kulcsszerepet játszik bolygónk éghajlatának szabályozásában. A rendszer fő eleme a Golf-áramlat, amely döntően befolyásolja...

Az új Dyson robotporszívó annyira okos, hogy talán már túlzás

MA 18:26

Az új Dyson robotporszívó annyira okos, hogy talán már túlzás

🤖 A Dyson Spot+Scrub MI az első kombinált robotporszívó és felmosó a gyártótól, amely valóban mindent bevet a makacs foltok ellen. Az új modell Berlinben mutatkozott be, és kerek,...

A Buypass bedobja a törölközőt az SSL-tanúsítványok piacán

MA 17:51

A Buypass bedobja a törölközőt az SSL-tanúsítványok piacán

2025. október 15-től a Buypass megszünteti a TLS/SSL-tanúsítványok kibocsátását, miután átfogóan értékelte a piac helyzetét és a szabályozói környezetet. Az üzleti tanúsítványokra vonatkozó szolgáltatások, valamint az e-azonosítási és...

Az eltűnt hideg vizek drámája: Panama óceánja felfordult

MA 17:26

Az eltűnt hideg vizek drámája: Panama óceánja felfordult

Idén először negyven év után nem történt meg a jól ismert áramlás, amikor a Panama-öböl mély, hideg vizei felszínre kerülnek. Ezt a természetes jelenséget, az úgynevezett feláramlást a...

Az MI ma már mindenhol ott van: Bízzunk benne?

MA 16:51

Az MI ma már mindenhol ott van: Bízzunk benne?

🤖 A mesterséges intelligencia (MI) már nem sci-fi, hanem életünk mindennapi részévé vált. Az egyszerű chatbotoktól a hatalmas, döntéseket befolyásoló algoritmusokig az MI egyre több területen jelenik meg. Az...

Fekete nap Tokióban, tényleg van okunk félni a Fuji kitörésétől

MA 16:27

Fekete nap Tokióban, tényleg van okunk félni a Fuji kitörésétől

🌊 Egy új MI-alapú videóban a japán hatóságok azt mutatják be, milyen pusztító hatásokkal járna, ha a jelenleg nyugalomban lévő Fudzsi-hegy minden előjel nélkül kitörne. Szerencsére jelenleg nem fenyeget...

Az európai PayPal-káosz: leálltak a milliárdos utalások

MA 15:51

Az európai PayPal-káosz: leálltak a milliárdos utalások

💳 Számos európai, köztük német bank fagyasztotta be átmenetileg a PayPalon keresztül érkező utalásokat, miután a platform csalásokat szűrő rendszere csődöt mondott. Emiatt a közvetlen terheléseket – összesen akár...

iPhone 17 Pro, ami simán lenyomja a Google Pixel 10 Pro-t

MA 15:27

iPhone 17 Pro, ami simán lenyomja a Google Pixel 10 Pro-t

Az Apple szeptember 9-én tartja éves eseményét, ahol várhatóan bemutatják az iPhone 17 szériát, köztük az iPhone 17 Pro-t és az iPhone 17 Pro Maxot is. Idén minden...

A Wall Streeten most is a magántőke vitte a prímet

MA 15:03

A Wall Streeten most is a magántőke vitte a prímet

💰 A globális magántőkeóriások és befektetési bankok 2025 első felében látványos toborzási hullámot indítottak, különösen a tőkebevonás, ügyfélkapcsolatok és marketing területein. Egyre nehezebb lett a tőkegyűjtés, miközben a piaci...