MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
A vállalatok hosszú távú sikerét ma már nem pusztán az határozza meg, milyen tehetségeket tudnak magukhoz vonzani, vagy mennyi pénzzel rendelkeznek, hanem hogy hol helyezik el működésüket, hogyan választják meg beszállítói láncaikat, illetve mely területeken ruháznak be...
A Himax részvényei csütörtökön berobbantak, és a vállalat helyzete egy csapásra megváltozott: az árfolyam több mint 16%-ot ugrott, 3 890 Ft-ra (10,63 USD) emelkedve...
💸 2025 jelentős változásokat hoz a 65 év feletti amerikaiak adózásában. Egy új adókedvezménynek köszönhetően több idős ember csökkentheti adóalapját, így az éves elszámoláskor kevesebb adót kell fizetnie...
Nagy-Britannia egyik legnagyobb orvosi kutatási adatbázisa, a UK Biobank, jelentős adatvédelmi botránnyal néz szembe: kutatók tucatnyi alkalommal szivárogtattak ki bizalmas egészségügyi adatokat az interneten...
Érdemes megvizsgálni, miként vált az Adobe előfizetési rendszere kellemetlenné a felhasználóknak: az amerikai igazságügyi minisztérium (DOJ) és a Szövetségi Kereskedelmi Bizottság (FTC) 2024-ben pert indítottak a cég ellen, mivel szerintük szándékosan bonyolulttá tették az előfizetés lemondását...
A kutatások egyre több bizonyítékot szolgáltatnak arra, hogy a szervezetben felgyülemlő mikroplasztikok súlyosan befolyásolhatják az immunrendszer működését...
🚀 Csalódott újrakezdők és egy, az AI-botokkal szemben teljesen tehetetlen csapat – a Digg Reddit-szerű újraindítása mindössze két hónapot bírt ki, mielőtt bezárták a platformot...
🎲 Bár a Google DeepMind Alpha-sorozatának MI-jei szenzációs teljesítményt nyújtanak sakktáblán vagy Go-ban, meglepően egyszerű játékokban, például a Nimben hajmeresztő hibákat vétenek...
🚀 Lényeges újdonság, hogy a Garmin-felhasználók mostantól két teljesen új Pokémon Sleep óralapot tölthetnek le ingyenesen, ráadásul a mindennapi alvásfigyelés is játékosabbá válik...
Dél-Olaszországban, Pontecagnano egykori dohánygyárának helyén 34 ókori sírt fedeztek fel, amelyek között két különös gyermeknyughely is feltűnt: a 2 500 éves sírokban két, 5–10 éves gyermeket felnőtt férfi harcosokra jellemző, nagy bronzövekkel temettek el...
Észak-Írország legnagyobb tavában, a Lough Neagh-ben, amely a lakosság mintegy 40 százalékának biztosít ivóvizet, többféle, antibiotikum-rezisztenciáért felelős gén jelenlétét mutatták ki...