MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
A fizika világában forrongás van kialakulóban: soha nem látott pontosságot ígérnek az új nukleáris órák, amelyekben nem a megszokott elektronátmeneteket, hanem atommagátmeneteket használnak az idő mérésére...
🔒 Többek között a Lockdown módnak (Lockdown Mode) köszönhetően az Apple-nek továbbra sincs tudomása arról, hogy bármelyik, e védelmet használó eszközt sikerrel feltörték volna kémprogrammal...
A Meta vezetősége előtt soha nem látott lehetőség nyílt: ha a cég 2031-re hatszorosára növeli értékét, minden érintett felsővezető akár 330 milliárd forintos (921 millió dolláros) részvénycsomagot is zsebre tehet...
A CERN-nél végre megtörtént, amire eddig senki sem vállalkozott: sikerült 92 antiprotont elszállítani teherautóval egy szupertrükkös, mágneses dobozban...
💰 A házasságban felborult bizalom, a váratlan szakítás és az anyagi bizonytalanság mindenkit megrázhat, de különösen veszélyezteti azokat a nőket, akik háttérbe szorítják saját pénzügyeiket...
Az amerikai űrkutatás új mérföldkőhöz érkezik: a NASA 2028 végéig útnak indítja a Space Reactor-1 Freedom űrhajót, amely nukleáris energiával hajtva halad majd a Mars felé...
💻 Lényeges szempont, hogy a munkahelyi számítógépek jelentős része elavult szoftvert futtat, ezzel folyamatosan veszélyezteti a vállalati biztonságot, és nehezíti a zavartalan munkavégzést...
A kutatók egyre több bizonyítékot találnak arra, hogy nemcsak a sport és a táplálkozás, hanem a bennünk élő egyes bélbaktériumok is hozzájárulhatnak izmaink erejéhez...
Egy ausztrál biotechnológiai cég most jelentős mérföldkövet ért el: élő emberi neuronokat tartalmazó chippel sikerült elérni, hogy játszani tudjon a legendás A Végzettel (Doom) nevű videojátékkal...
Egy évvel a FreeBuds Pro 4 megjelenése után a HUAWEI most bemutatta legújabb zászlóshajó fülhallgatóját, a FreeBuds Pro 5-öt, amely első látásra letisztult AirPods-hasonmásnak tűnhet, de valójában számos izgalmas extrát tartogat azok számára, akik csúcskategóriás funkciókat keresnek elérhető áron...
🕴 A tapasztalt űrhajós, Michael Fincke drámai egészségügyi vészhelyzetet élt át januárban a Nemzetközi Űrállomáson, amikor hirtelen képtelenné vált megszólalni...
🤖 Ami először apróságnak tűnt, ma már az egész kriptoiparágra kiható biztonsági kérdéssé nőtte ki magát: hogyan lehet egy több mint tízéves blokkláncot a modern igényekhez igazítani – főleg, miközben komoly intézményi szereplők készülnek rákapcsolni?..
Na, nem mindennapi show-t csapott a brit Pulsar Fusion: a csapat végre plazmát lobbantott a kísérleti nukleáris fúziós rakétájukban, amivel óriási lépést tettek az űrutazás jövője felé...
Érdemes megvizsgálni, hogy az AMD ismét meglepi a PC-s világot: a Ryzen 9 9950X3D2 Dual Edition piacra dobásával olyan processzort kínál, amely már 208 MB gyorsítótárral rendelkezik...
A bolygó szinte minden környezete tele van szórva élőlények DNS-ével. Amikor egy szervezet áthalad egy területen – legyen az víz, talaj vagy levegő –, elkerülhetetlenül hátrahagyja genetikai nyomát...
Külön említést érdemel, hogy a négyfős űrhajóscsapat, az Artemis II legénysége végre megérkezett Floridába, néhány nappal a világtörténelmi jelentőségű holdmisszió előtt...