MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő

MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk. A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.

Nem egészen a klasszikus játék

Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.

A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.

Meglepő eredmények

A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.

A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.

Játékok mint teljesítménymérők

A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.

 

Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.

De legalább nézhetjük, ahogy az MI Mariót játszik.

  • Te milyen más nem hagyományos módszereket próbálnál ki az MI-k teljesítményének mérésére?
  • Ha te lennél a kutatócsoport vezetője, hogyan változtatnál a jelenlegi megközelítésen a játékok használatát illetően?


Legfrissebb posztok

hétfő 21:00

Az Instagram felrobbant: Kylie Jenner ismét bikiniben pózol

A hétfői rosszkedvre itt a tökéletes ellenszer: Kylie Jenner újabb bikinis szelfivel lepte meg követőit, és elképesztően néz ki...

MA 17:01

Az altcoin ETF-láz berobban: az XRP és a Solana újra csúcson

🔥 A kriptopiac bizonytalansága közepette az USA-ban a spot altcoin ETF-ek, köztük a Solana és az XRP, hétfőn is jelentős tőkebeáramlást könyveltek el, miközben a piac egésze esik, a hangulat pedig feszült...

MA 16:34

Az EP 241021a rejtélye: villámgyors röntgenjel egy haldokló csillagtól?

Egy nemzetközi csillagászcsoport földi és űrtávcsövek segítségével vizsgálta az EP 241021a nevű, gyors röntgentranzienst...

MA 16:17

Az Amazon szuperszámítógépei kihúzzák Washingtont a bajból?

💻 Az Amazon Web Services óriási beruházásba vág: a következő években mintegy 1,3 gigawatt összteljesítményű új adatközpontokat épít kizárólag az amerikai kormány részére, akár 18 ezer milliárd forint (50 milliárd USD) értékben...

MA 16:02

Az ideális útitárs néha bárki – csak nem a család

🚂 Közeledik az ünnepi utazási szezon, és egy friss kutatás szerint a tökéletes útitárs nem feltétlenül a családtag...

MA 15:49

A Huawei Mate 80 Pro Max: vakító fény a zsebedben

💡 A Huawei bemutatta új Mate 80 szériáját Kínában, ahol a Mate 80 Pro Max rendkívül fényes, 6,9 colos, dupla rétegű OLED kijelzője mindenkit lenyűgöz...

MA 15:34

A valódi Tutanhámon-rejtély: lefejezés és évszázados eltussolás

🔮 1925 novemberében, száz évvel ezelőtt kerültek először tudományos vizsgálat alá Tutankhamon múmiájának maradványai...

MA 15:18

Az örökség tabuja: miért hallgatnak a szülők a pénzről?

Felmerül a kérdés, hogy vajon miért titkolják a szülők, milyen örökség vár a gyerekeikre – pedig a családok többségében elképesztő összegek cserélnek majd gazdát...

MA 15:02

Az ikertornádók éve: brutális pusztítás Mississippiben

🌩 Márciusban egy halálos vihar maradandó nyomot hagyott Mississippi állam tájain: a Landsat 8 műhold különleges műholdfelvételt rögzített Tylertown közelében, amelyen két, szinte teljesen párhuzamos tornádónyomvonal látható...

MA 14:50

Az Ox Bel Ha, a Föld leghosszabb víz alatti labirintusa

🚢 A mexikói Yucatán-félsziget alatt húzódó Ox Bel Ha barlangrendszer (jelentése: három vízi út a maja nyelven) a leghosszabb víz alatti barlang a világon...

MA 14:34

Az ősi belga barlang sötét titka: kannibalizmus és halál

A belgiumi Goyet-barlangban előkerült neandervölgyi csontok hátborzongató titkot rejtenek. Mintegy 45 000 évvel ezelőtt egy csoport neandervölgyi embertársait felfalta – és nem is akárhogy: elsősorban nőket és gyerekeket választottak áldozatul...

MA 14:17

A Facebook új becenevei: végre nem kötelező a valódi név!

👤 A Facebook újabb lépést tett afelé, hogy jobban hasonlítson a Redditre, ugyanis már a Facebook-csoportokban is lehetőség van becenéven posztolni, nem a valódi néven...

MA 14:01

Az ingatlanpénzügyi óriást adatlopási botrány rázza meg

SitusAMC, az egyik legnagyobb pénzügyi szolgáltató, november elején felfedezett adatlopásról számolt be, amely jelentős ügyféladatokat érintett...

MA 13:49

Felfedték az emberi sejtek titkos riasztórendszerét

A riboszómák nemcsak a fehérjék gyártásáért felelősek, hanem sejtjeink védelmi rendszerének első vonalát is jelentik...

MA 13:33

A részecskegyorsítók mellékterméke áttörést hozhat a rákkezelésben

💫 A nagy teljesítményű részecskegyorsítókban termelődő, eddig kihasználatlan energiát mostantól értékes orvosi izotópok előállítására lehetne felhasználni, állítják a Yorki Egyetem kutatói...

MA 13:18

A smaragdzöld festékek rejtélye: miért fakulnak a mesterművek?

Jó példa erre, amikor a 19. században elterjedt mesterséges smaragdzöld festékek bámulatosan élénk árnyalatukkal forradalmasították a művészetet...

MA 13:02

A tea és a kakaó: az ülőmunka váratlan szövetségesei

Többek között a tea, a bogyós gyümölcsök, az alma és a kakaó rendszeres fogyasztása bizonyítottan segíthet megvédeni a férfiak érrendszerét az ülő életmód rejtett káros következményeitől...

MA 12:36

Az élőlény, amely megkérdőjelezi, mit is nevezünk életnek

🦑 Az élet legfőbb szerkezeti egysége a sejt, hiszen minden élőlény abból épül fel, és a biológia szerint az alapvető életjelenségek – mint a biomolekulák feldolgozása, a növekedés, az örökítőanyag másolása és az önálló szaporodás – mind a sejt működéséből származnak...

MA 12:17

Az ózonlyuk zsugorodott: az elmúlt 30 év ötödik legkisebbje

A déli-sarkvidéki ózonlyuk 2025-ben az elmúlt harminc évben feljegyzett ötödik legkisebb méretére zsugorodott...