Régi világtérképekkel hódít újra a mesterséges intelligencia

Régi világtérképekkel hódít újra a mesterséges intelligencia
Az emberi gondolkodás a világ működéséről alkotott belső modelleken alapul: tudjuk, hogy nem lépünk a sínekre, amikor jön a vonat, még ha sosem próbáltuk ki ennek következményeit. Érdemes kiemelni, hogy a legújabb MI-kutatások – főként az általános mesterséges intelligencia (AGI) irányába tartók – egyre inkább azt vallják, hogy gépeinknek is kellene valami hasonlót tudniuk. A világmodell, vagyis a külvilágról alkotott belső reprezentáció már régóta nem újdonság: a pszichológiában, robotikában és gépi tanulásban évtizedek óta jelen van, most azonban ismét a figyelem középpontjába került.

A világmodell gyökerei: egy elfeledett skót pszichológus nyomán

A fogalom gyökerei egészen 1943-ig nyúlnak vissza, amikor Kenneth Craik, egy skót pszichológus felvetette: ha egy szervezet fejében ott van egy kicsinyített modell a valóságról, akkor jobban, gyorsabban és biztonságosabban tud dönteni, gondolkodni, cselekedni. A számítástechnikai korszak hajnalán a Craik által megálmodott mentális modellek akkor váltak igazán fontossá, amikor a kognitív tudomány és az MI összekapcsolódott. A hetvenes évek MI-pionírjai például a blokkok világa (blocks world) egyszerűsített világmodelljével próbáltak absztrakt következtetésekhez és elemzési képességhez jutni.

Ezzel szemben a túl bonyolult, kézzel készített modellek gyorsan elavultak; Rodney Brooks MI-kutató például végül teljesen elvetette őket a ’80-as évek végére, mondván: a világ önmagának a legjobb modellje – a mesterséges absztrakciók csak gátolják a hatékonyságot.

A deep learning forradalma: szabályok helyett tapasztalati tudás

A fordulatot a gépi tanulás, főként a mesterséges neurális hálózatok hozták: ezek képesek voltak saját környezetükről belső közelítéseket kialakítani, kézzel írt szabályok nélkül. Így már lehetséges volt például egy virtuális versenyautó vezetése, vagy éppen chatbotok, mint a ChatGPT létrehozása, amelyek számtalan hétköznapi láncolatot „látnak előre”. Ahogy ezek a nyelvi modellek egyre váratlanabb, szakterületen kívüli feladatokat is meg tudtak oldani, sok kutató (például Geoffrey Hinton, Ilya Sutskever és Chris Olah) feltételezte, hogy ezekben az MI-kben valahol megbújnak a Craik nevéhez fűződő mini-világmodellek.

Káosz és szabályrendszerek: van-e tényleg belső világtérkép?

Ez alapján arra lehet következtetni, hogy ezek a nagy és bonyolult MI-k valójában nem átfogó világmodellekkel, hanem inkább elszigetelt, gyakran egymásnak ellentmondó heurisztikák gyűjteményével dolgoznak. Ez a vak emberek és az elefánt történetére emlékeztet: aki a farkát fogja, kötelet gondol, aki a lábát, facsonkra tippel. Amikor például egy nagy nyelvi modellből próbálnak konzisztensebb játékmodelleket előcsalni – mondjuk egy Othello-tábla egészének digitális ábrázolását – rendre csak részleteket találnak: egy kis kígyót, egy kis fát, egy kis kötelet, de az egész elefánt, azaz a teljes kép hiányzik.

Mindez azonban nem teszi értéktelenné ezeket a rendszereket. Képesek például szinte tökéletes navigációs útmutatást adni Manhattanben két pont között – anélkül, hogy valós, átfogó térképet alkotnának a városról. Amint azonban a kutatók véletlenszerűen elzártak 1%-nyi utcát Manhattanből, a MI teljesítménye összeomlott. Ha világmodell állt volna mögötte, nem okozott volna gondot az akadályok megkerülése.


A valódi világmodellek jelentősége és a jövő kihívásai

Ennek fényében nem csoda, hogy a legnagyobb MI-laborok világszerte saját világmodelleken dolgoznak, és a kutatók is egyre nagyobb lendülettel merülnek el a kérdésben. Egy igazán robusztus, ellenőrizhető világmodell nemcsak az AGI szent grálját jelentheti, hanem megbízhatóbb, átláthatóbb és értelmesebb döntéshozatalt, valamint a MI által generált „hallucinációk” csökkentését is ígéri.

Azt viszont továbbra sem tudja senki, hogyan lehet ezt a célt a leggyorsabban elérni. A Google DeepMind és az OpenAI a multimodális, azaz szövegen túl videókat, szimulációkat, 3D adatokat is használó tréningekben hisz; a Meta kutatója, Yann LeCun szerint viszont teljesen új, nem generatív MI-architektúra szükséges. A közös cél: a világ belső digitális hókristálygömbjének – egy modellezhető, átfogó valóságképnek – megtalálása. Hogy mindebből valaha sikerül-e használható MI-t alkotni? Egyelőre csak remélhetjük, hogy a valódi elefántot fejlesztjük, nem csak újabb köteleket, fákat és kígyókat.

2025, adminboss, www.quantamagazine.org alapján

  • Mit gondolsz, egy MI-nek mindig kell-e használnia belső világmodellt?
  • Szerinted etikus lenne, ha a gépek maguk dönthetnének a világról szóló modelljeikkel?
  • Mit tettél volna akkor, ha azt látod, hogy egy rendszer rossz következtetésre jut a részleges tudása miatt?



Legfrissebb posztok

Az MI tényleg védelmet ad, valódi kontrollt nyújt, nem csak üres ígéret

MA 20:04

Az MI tényleg védelmet ad, valódi kontrollt nyújt, nem csak üres ígéret

🛡 Az MI nemcsak új távlatokat nyit, hanem kockázatokat is jelent. Aki lépést akar tartani a technológiával, annak biztonságra, kontrollra és átláthatóságra van szüksége – hiszen a cégek ma...

Az acélhidak rejtett túlélési trükkjei

MA 19:52

Az acélhidak rejtett túlélési trükkjei

A világ hídjai nap mint nap extrém terhelésnek vannak kitéve: akár földrengés, akár súlyos ütközés éri őket, egyetlen hiba is végzetes következményekhez vezethet. Mégis, sok acélrácsos híd ilyen...

Véletlenül felfedezte a NASA az idegen üstököst, mielőtt kellett volna

MA 18:51

Véletlenül felfedezte a NASA az idegen üstököst, mielőtt kellett volna

A NASA egyik űrtávcsöve, a TESS, már két hónappal a hivatalos felfedezés előtt észrevette a ritka, naprendszeren túlról érkező 3I/ATLAS üstököst. Különösen fontos hangsúlyozni, hogy az akkor készült...

Az éghajlat a tomboló erdőtüzeink új főszereplője lett

MA 18:26

Az éghajlat a tomboló erdőtüzeink új főszereplője lett

2025 nyarán példátlan pusztítást okoztak az erdőtüzek Törökországban, Görögországban és Cipruson. A halálos lángok 20 áldozatot követeltek, 80 000 embert kényszerítettek otthonuk elhagyására, és több mint egymillió hektárnyi...

Tündérkörök alatt titkos hidrogénvagyon lapul

MA 18:02

Tündérkörök alatt titkos hidrogénvagyon lapul

🧙 Az energiaátmenet kulcsa lehet a mélyben rejtőző természetes hidrogén, ám nehéz megmondani, pontosan hol és milyen mélységben képződik belőle nagyobb mennyiség. Egy friss kutatás szerint azonban a rejtélyes...

Az új Samsung Galaxy S26 Edge olyan, mint egy iPhone?

MA 17:51

Az új Samsung Galaxy S26 Edge olyan, mint egy iPhone?

A Samsung Galaxy S26 Edge kiszivárgott képei alapján a telefon dizájnja kísértetiesen emlékeztet az iPhone 17 Pro-ra (iPhone 17 Pro). Az S26 Edge szinte teljesen keret nélküli kijelzővel...

Az új Ford F-150 Lightning STX besétál a porondra

MA 17:26

Az új Ford F-150 Lightning STX besétál a porondra

🚗 A Ford igyekszik megmenteni az F-150 Lightning eladási számait, amelyek idén csaknem 10%-kal csökkentek a tavalyi évhez képest. A villanyos pickup friss érdeklődést generálhat az új STX kivitel...

Az univerzum titka: miért létezünk egyáltalán?

MA 17:01

Az univerzum titka: miért létezünk egyáltalán?

🧠 Az univerzum létezése egyetlen, különös okra vezethető vissza: az anyag és az antianyag nem képesek békében megférni egymás mellett. A világegyetem születésekor jelentéktelennek tűnő, mégis végzetes aránytalanság alakult...

Az év napfogyatkozása: csak pingvinek és néhány szerencsés ember láthatja

MA 16:26

Az év napfogyatkozása: csak pingvinek és néhány szerencsés ember láthatja

🌌 Szeptember 21-én részleges napfogyatkozás lesz, amely szinte egybeesik a szeptember 22-i napéjegyenlőséggel. Míg az északi féltekén alig lehet majd észrevenni, az új-zélandiak, a Déli-sarkon telelő kutatók és rengeteg...