MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
💸 Kibuktak a menő netes csalók, akik 45 millió dollárnyi kriptót akartak lecsapolni a gyanútlanoktól, de a rendőrök átlépték a digitális határokat, és 4,4 milliárd forintnyi ellopott összeget zároltak...
Azok a dolgozók, akiket az MI fejlődése miatt bocsátanak el, jóval nehezebben találnak új munkahelyet, és jelentős gazdasági hátrányokkal néznek szembe...
Van az úgy, hogy magyarázatból sosem elég – de ha valaki vizuális típus, ezerszer könnyebb felfogni egy bonyolult témát, ha rögtön látod is, miről van szó...
🐒 Jellemző példa erre, hogy az ugandai Kibale Nemzeti Parkban élő vadcsimpánzok hosszú évek óta tartó megfigyelése során most először figyelhették meg a kutatók, ahogy egy korábban egységes közösség kettészakadása halálos konfliktushoz vezetett...
Eljutottunk oda, hogy mostantól klónozhatod magad a YouTube-on – digitálisan. Az új avatar-funkcióval percek alatt teremthetsz egy olyan alteregót, amely pontosan úgy néz ki és beszél, mint te, de cserébe soha többé nem kell beülnöd a kamera elé...
💀 Milyen para már, amikor a Mac-ed hirtelen megáll, pedig csak békésen szöszmötöl az irodában vagy a gardróbban, egy csomó fontos feladattal a háttérben?..
Na hát ennyit erről, hogy az Instagramon minden örök – mostantól visszavonhatod vagy kijavíthatod a kommentjeidet, amelyeket posztok alá írsz, persze csak 15 percen belül...
Nakamoto, SharpLink és Strive nevét most érdemes megjegyezni: ezek a digitális vagyonkezelő cégek a legnagyobb zuhanás után akár a bitcoin ETF-eknél is jobban teljesíthetnek...
Egy fejlett, Lua-alapú, LucidRook nevű kártevő ütötte fel a fejét Tajvanon, amely nonprofit szervezeteket és egyetemeket támad phishing (adathalász) e-mailekkel...
Az égbolt szerelmesei hetek óta készültek arra, hogy idén tavasszal átélhessék a rendkívüli látványt: egy új „napközeli” – vagyis extrém közel a Naphoz suhanó – üstökös tűnt fel, amely akár nappal is látható fényességet ígért...
Ma olyan mérföldkövek sorjáznak, mint a Statute of Anne első szerzői jogi törvénye, a pingpong-diplomácia áttörése, és a szmolenszki légikatasztrófa tragédiája...
Áprilisban igazán izgalmas időszak vár az Xbox Game Pass előfizetőire: díjnyertes folytatások, zseniális új független címek, klasszikusok ráncfelvarrott kiadásai és persze jó néhány addiktív gyöngyszem kerül fel a platformra...
A mesterséges intelligencia fejlesztésének egyik legfőbb kihívása, hogy olyan autonóm ügynökök épüljenek, amelyek képesek alkalmazkodni a környezet változásaihoz anélkül, hogy az alapul szolgáló nagy nyelvi modellt újra kellene tanítani...
💉 Míg az elmúlt években a Lyme-kór egyre komolyabb egészségügyi problémává nőtte ki magát, most új remény villant fel: a Pfizer és a Valneva közös fejlesztése révén egy hatékony vakcina kerülhet a piacra, amely segíthet megfékezni ezt a kullancsok által terjesztett betegséget...