MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
🚀 Több évnyi kutatómunka és a legújabb NASA-eredmények alapján egyre több adat utal arra, hogy a Mars felszínéről származó kőzetekben talált rendkívüli szerves vegyületeket élőlények hozhatták létre...
A NASA több mint ötven év után ismét a Holdhoz készül visszatérni, és ezúttal történelmet ír: a következő Artemis II-küldetésen először utazik fekete és női űrhajós is a Holdhoz...
Azt vizsgáljuk, hogy az Egyesült Államok szövetségi védőoltási javaslatainak átalakítása után miként próbálják az egyes államok megőrizni a gyerekek számára az ingyenes és könnyen hozzáférhető oltásokat...
🤖 Az OpenAI pénteken bejelentette, hogy óriási, 110 milliárd dolláros befektetés érkezik az Amazon, az Nvidia és a SoftBank részéről, miközben a cég értékét már 730 milliárd dollárra teszik...
🔋 Fontos kérdés, hogy egyre több készüléket és gyorstöltőt párosítva meddig kell még bosszankodnunk amiatt, hogy az USB-C-vel is gyakran káoszba fullad az élmény: a különféle gyorstöltési szabványok, a gyártói protokollok meg a hosszú távú akkumulátor-élettartam miatt csak kevesen oldották meg tényleg jól a problémát...
Amerikai egészségügyi és oktatási intézmények ellen indítottak támadásokat az elmúlt hónapokban olyan digitális behatolók, akik feltételezhetően Észak-Koreához köthetők...
🚀 A Földön kívüli villámok létezése már nem újdonság, hiszen a csillagászok korábban is észleltek villámlást a Jupiteren, a Szaturnuszon és a Neptunuszon...
🎥 Minden idők egyik legnagyobb médiafúziója jöhet létre, miután hivatalossá vált, hogy a Paramount több mint 40 ezer milliárd forint (110 milliárd USD) értékben felvásárolja a Warner Bros...
⚡ A motoros világ figyelme a Donut Labra irányult, miután bemutatták első gyártásérett szilárdtest-akkumulátorukat, amely a jelenlegi ismereteink szerint döbbenetesen gyors töltést tesz lehetővé...
A legutóbbi Windows 11 Insider Preview frissítések most komoly lendületet adnak a batch fájlok és CMD-szkriptek futtatásának biztonságában és sebességében...
🦠 Érdekesség, hogy 2026 első két hónapjában az Egyesült Államokban már 1 136 kanyarós megbetegedést regisztráltak, ami a tavalyihoz képest jóval gyorsabb terjedést jelez...
Jack Dorsey, a Block (korábban Square) alapítója nem kertelt: szerinte eljött az az idő, amikor a mesterséges intelligencia már valóban az emberek munkáját veszi át...
A Titan, a Szaturnusz legnagyobb holdja, eredetileg két ősi hold gigantikus ütközéséből születhetett, amely nemcsak a teljes holdrendszert formálta át, hanem közvetve a Szaturnusz ikonikus gyűrűinek születésére is hatással lehetett...
Elképesztő fotók érkeztek a James Webb-űrtávcsőtől: a Vela csillagképben, tőlünk nagyjából 2 300 000 000 000 000 000 km-re (azaz 5 000 fényévre) a PMR 1 nevű köd úgy néz ki, mintha egy átlátszó koponyában villámok járnák át az agytekervényeket...
Érdemes megvizsgálni, milyen új korszakot nyithat meg a Google legújabb beruházása Minnesota államban, ahol egy adatközpontot épít, amelyet szinte kizárólag tiszta energiával látnak el...
Az okostelefonok és számítógépek világa komoly átalakulás előtt áll: a várakozások szerint a készülékek kevesebb memóriával, szerényebb képességekkel, mégis jóval magasabb áron érkeznek majd 2026-ban...
Az MI fejlesztésében az utóbbi időben egyre élesebb a verseny, de most újabb fordulóponthoz érkeztünk: az OpenAI megállapodott az amerikai védelmi minisztériummal, hogy saját MI-modelleit az ügynökség rendszereibe telepítik...
Az MI világában új nagyhatalmi játszma bontakozik ki: a SoftBank 8 500 milliárd, az Nvidia 8 500 milliárd, az Amazon pedig 14 100 milliárd forintot fektet az OpenAI-ba...
🕵 Egy nagyszabású, egy évig tartó nyomozás végén harminc embert letartóztattak, 179 gyanúsítottat pedig összefüggésbe hoztak a The Com nevű online bűnözői csoporttal, amely gyerekek és tinédzserek ellen irányuló zsarolásban, erőszakos cselekményekben és gyermekpornográfia előállításában vett részt...