MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
filózó
Te milyen más nem hagyományos módszereket próbálnál ki az MI-k teljesítményének mérésére?
Ha te lennél a kutatócsoport vezetője, hogyan változtatnál a jelenlegi megközelítésen a játékok használatát illetően?
Ez a jelenség jól illusztrálható azzal, hogy miként változtatta meg az ETF a globális pénzügyi piacokat, és most ugyanez az átalakulás érkezik meg a tokenizációval...
Idén egy meredek jóslat borzolja a kriptovilág kedélyeit: Tom Lee, a Bitmine elnöke szerint az ether értéke akár 250 000 dollárig – vagyis közel 90 millió forintig – nőhet, így az Ethereum hálózat teljes értéke 30 ezer milliárd dollár, azaz bő 10 800 ezer milliárd forint lenne...
Érdemes megvizsgálni, miként mozgatja a piacokat egy-egy ismert befektető véleményváltása: nemrég a Hyperliquid egyik legnagyobb támogatója, a BitMEX társalapítója, Arthur Hayes minden HYPE-tokenjét eladta, pedig napokkal korábban még 150 dolláros, azaz több mint 55 ezer forintos árfolyamot jósolt...
Jellemző példa erre, hogy a kutatók most különleges felfedezést tettek Johann Wolfgang von Goethe, a híres német író gyűjteményéhez tartozó balti borostyánok között...
A spanyol válogatott újabb mérkőzésre készül, amelyet az iraki válogatott ellen játszanak a 2026-os labdarúgó-világbajnokságot megelőző felkészülési sorozatban...
🌌 Az ember kíváncsisága nem ismer határokat: miközben a múlt kultúráit feltárja, egyre többen kutatják, mire képes a modern ember az extrém környezetekben – legyen szó a Nemzetközi Űrállomásról (ISS) vagy a Mount Everestről...
⚽ Egy lényeges szempont, hogy a Roku folyamatosan bővíti a kínálatát, és most négy vadonatúj, teljesen ingyenes sportcsatornával lepte meg a sportrajongókat – köztük két FIFA-csatornával, időzítve a női labdarúgó-világbajnokság előtt...
Érdemes megérteni, hogy a legkifinomultabb módszerekkel vadásznak titkokra azok, akik a hadsereghez, a titkosszolgálatokhoz vagy a kormányhoz közel dolgoznak...
🍕 Villámgyorsan felháborodás övezte a bejelentést, miszerint a következő Hadisten (God of War) játékban nem Kratos, hanem a felesége, Faye lesz a főszereplő...
A gamer egérgyártók újításaival most egészen új szintre léphet a játékélmény: a Keychron legújabb egere már olyan kapcsolókkal érkezik, amelyek két teljesen eltérő technológiát egyesítenek...
💸 Az elmúlt napokban jelentős ármozgások rázták meg a kriptovaluták piacát, miután a Bitcoin árfolyama 61 300 dollárig zuhant, mielőtt ismét visszakapaszkodott volna 62 500 dollárig...
A techvilág egy egészen különleges monitorral lepte meg idén a Computex látogatóit: a Loop LP-3201 nem csupán egy szimpla 32 colos WQHD kijelző, hanem egy teljes értékű all-in-one PC, amelyben ráadásul helyet kapott egy videókártya-foglalat...
Fontos kérdés, hogy sikerül-e még idén elfogadni az Egyesült Államokban a digitális eszközök piacát átfogóan szabályozó, Clarity Act nevű törvényjavaslatot...
💀 A 20. század nagy részében magától értetődő volt, hogy minden újabb generáció hosszabb életre számíthat a korábbiaknál, köszönhetően a fejlettebb egészségügynek, jobb táplálkozásnak, magasabb életszínvonalnak...
A Galax Hall of Fame (HOF) szériája gyakran hívja fel magára a figyelmet merész dizájnjaival és borsos áraival, de az idei Computexen bemutatott következő generációs GPU-prototípus még így is túlzásnak tűnik...
Erre utal többek között az, hogy a kriptovaluta-piac mostanában különösen viharos időszakot él meg: a Bitcoin az elmúlt hét napban 14 százalékot veszített értékéből, olyan mélységbe süllyedve, amire legutóbb a februári összeomláskor volt példa...
🔑 Fél év alatt az MI-ügynökök meghódították a nagyvállalatokat, ahol már nemcsak pilotként működnek, hanem éles üzemben, valós folyamatokat támogatnak és döntéseket hoznak...
A legújabb A Heroes Journey frissítés nemcsak Herkulest és Philt hozta el a Disney Dreamlight Valley világába, hanem egy izgalmas új birodalmat is megnyitott, tele kihívásokkal és kalandokkal...
Egy nemzetközi kutatócsoport egy különleges kvantumjelenség titkát fejtette meg, amely a jövőben lehetővé teheti, hogy elektronikai eszközök elemek nélkül működjenek...