MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
Egy kaliforniai startup, a Karman Industries merőben új módszerrel hűti a szerverközpontokat: a SpaceX rakétamotorjainak technológiáját vetette be, hogy kevesebb árammal, víz nélkül, ráadásul sokkal kisebb helyigénnyel működjön a rendszer...
🌳 A világ vezetői már 2015-ben elköteleződtek a nettó zéró kibocsátás mellett, azonban a cél közel sem olyan könnyen elérhető, mint sok ország remélte – még ott sem, ahol hatalmas erdőterületek vannak, amelyek elvileg elnyelik a szén-dioxidot, ha megállítják az erdőirtást...
Legújabb vészfrissítését adta ki a Microsoft a Windows 11-hez, miután ismét kritikus hibákat találtak az Outlookban és a felhőben tárolt fájlok kezelésében...
🌨 Az Egyesült Államokon végigsöprő rendkívüli téli vihar legalább 10 ember halálát okozta, miközben az utazók, a légiközlekedés és háztartások tömegei küzdenek a rendkívüli kihívásokkal...
Miközben a világ vezetői Davosban a rivaldafényben vitatták meg a globális gazdaság kihívásait, Kína csendben, de határozottan erősítette pozícióját, kihasználva az USA és szövetségesei közötti növekvő feszültségeket...
Az MI-rendszerek rohamos fejlődése mellett egyre hangsúlyosabbá válik az igény, hogy ne csak feladatokat oldjanak meg, hanem valódi csapatmunkára is alkalmasak legyenek...
👀 Az Univerzum egyik legszebb látványát örökítette meg a James Webb űrteleszkóp, amikor a Helix-köd (NGC 7293, Caldwell 63), más néven „Isten szeme” vagy „Szauron szeme” belsejébe pillantott...
Érdemes megvizsgálni, hogy egy vakítóan fehér mosolyért tényleg szükséges-e kisebb vagyont hagyni egy fogorvosi rendelőben, vagy elég az otthoni fogfehérítő csíkokat használni, amelyek lényegesen olcsóbbak és bárki számára elérhetők...
💬 A ChatGPT ideiglenes csevegés funkciója jelentős frissítést kap. A fejlesztésnek köszönhetően mostantól akkor is megmaradhatnak a személyes beállításaid és stílusod, ha ideiglenes módban csevegsz, miközben ezek a beszélgetések továbbra sem befolyásolják a fiókodat...
🚤 Többek között Indonézia partjai előtt kutatta a mélytengeri hegyeket idén januárban az OceanXplorer, az OceanX milliárdosok által támogatott nonprofit szervezetének csúcstechnológiás kutatóhajója...
👶 Érdemes megvizsgálni, milyen szerepet játszik az óvodai közösség a csecsemők egészségében: ma már bizonyított, hogy a közös játék és a szociális interakciók hatására a babák nemcsak kórokozókat, hanem jó baktériumokat is átadnak egymásnak...
🔴 Az XRP árfolyama közel 4%-ot esett, miután a bitcoin árfolyama 32 millió forint (88 000 USD) alá csúszott vasárnap, ezzel újra a figyelem középpontjába került az 1,88 dollár (kb...
Vasárnap a bitcoin 88 000 dollár (~32,2 millió forint) alá csúszott, mivel a piacokat a várható amerikai kamatdöntés és a gyorsan közeledő nagy techcégek gyorsjelentései tartják feszültségben...
🚧 A hétfői kereskedésben az ázsiai–csendes-óceáni régió tőzsdéi vegyesen teljesítettek, mivel a befektetőket továbbra is a geopolitikai aggodalmak tartják éberen...
Ami kezdetben ártalmatlannak tűnt, mára a modern orvoslás egyik legnagyobb fenyegetésévé vált: az antibiotikum-rezisztencia nemcsak korábban egyszerűen kezelhető fertőzéseket tesz újra halálossá, de veszélyezteti a műtéteket, a kemoterápiát és a szervátültetéseket is...