MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
Érdekes, hogy a kilencéves Kai Moskvitch hobbiból podcastet indított, amelyben azt kutatja, miként változtatja meg a mindennapjainkat a kvantumtechnológia...
💸 Az Anna’s Archive nevű nyílt könyvtárat és keresőmotort 115 milliárd forint (322 millió dollár) kártérítés megfizetésére kötelezték, miután állítólag letöltötte és elmentette a Spotify teljes zenegyűjteményét...
Közeleg az az idő, amikor az uniós tinik nemcsak szívüket, hanem életkorukat is egy appban hordozzák: az új digitális igazolványalkalmazás lehetővé teszi, hogy bárki igazolja a korhatáros tartalmakhoz való hozzáférési jogosultságát, miközben személyes adatai titokban maradnak...
🤔 Fontos kérdés, hogy az utóbbi években áttörésként ünnepelt Alzheimer-kór elleni gyógyszerek mennyire képesek valóban lassítani vagy megelőzni a betegség előrehaladását...
🤖 Például ha régóta vágytál rá, hogy MI-modellek a saját preferenciáid, emlékeid vagy Google Fotóid alapján alkossanak képeket, ez most valóra válhat...
A modern világ egyik kulcsfontosságú alapanyaga, a lítium meglepő helyen bukkant fel: ősi palák és ipari hulladékok tartalmazhatják ezt az értékes fémet...
A Google tavaly 8,3 milliárd rosszindulatú hirdetést állított le, és közel 25 millió hirdetői fiókot függesztett fel – köztük 602 ezret csalással összefüggésben...
💸 Érdekes fejlemény, hogy a kvantumszámítógépes vállalatok részvényei szárnyalni kezdtek, amint az Nvidia bemutatta új, nyílt forráskódú MI-modelljeit, amelyek a kvantumtechnológia gyorsítását célozzák...
A Földtől mindössze 7000 fényévre található Cygnus X-1 az elsőként felfedezett és megerősített fekete lyuk, amely most is komoly meglepetésekkel szolgál...
Különösen igaz ez akkor, ha a technológia mindennapjaink részévé válik: egy friss amerikai és brit kutatás szerint már tíz perc MI-használat is elég ahhoz, hogy függőséget alakítson ki, ami a gondolkodási képességek látványos romlásához és gyors kimerüléshez vezet, ha utána hirtelen megvonják az eszközt...
🖥 Az elmúlt időszakban minden beszélgetés, fórum és előadás a munka jövőjére és arra a kérdésre összpontosított: hogyan tudunk alkalmazkodni a mesterséges intelligencia villámgyors fejlődéséhez?..
Négy fiatal kutató egy elképesztően izgalmas kütyüt rakott össze: úgy tudnak illatélményt előidézni, hogy közben nem kell semmiféle vegyi patronnal vacakolni...
🔥 A legutóbbi tesztek alapján egyértelműen látszik, hogy a Google Pixel mobilok hardvere jelentősen lemaradt játékos teljesítmény terén vetélytársaikhoz képest...
Az MI‑modellek fejlődése az utóbbi időben valósággal kirobbanó: gyakorlatilag minden héten új modell jelenik meg, mindegyik egyre hatékonyabbnak vagy sokoldalúbbnak tűnik...
⚠ A Nemzetközi Energiaügynökség (IEA) figyelmeztetése szerint Európa alig hat hétre elegendő kerozinnal rendelkezik, ami drámai következményekkel járhat a kontinens gazdaságára nézve...
🗓 Az öregedéssel járó károsodások egyik fő okozóját sikerült azonosítani amerikai kutatóknak: a szervezetben csendben felgyülemlő úgynevezett „zombi” immunsejteket...
Az elmúlt napokban a bitcoin árfolyama 27,2 millió forint körül ingadozik, miközben a figyelem egyre inkább az altcoinok, különösen az XRP, a Plasma és a dogecoin felé fordul...
Erre utal többek között az is, hogy idén októbertől néhány japán szupervonaton már exkluzív, privát lakosztályok is elérhetők lesznek, amelyekben 5G-antennával ellátott üvegablakok és zajszűrő technológia gondoskodik a kényelmes utazásról...
🕵 Tipikus eset, amikor jól szervezett csalás miatt milliókat veszít rengeteg vállalat, miközben a háttérben csak néhány, elsőre jelentéktelennek tűnő szereplő húzza a hasznot...
🚀 Közel lehetünk ahhoz, hogy két történelmi Hold-misszió rajtoljon el, melyek célja a Shackleton-kráter vidéke, a Hold déli pólusának egyik legérdekesebb és leggazdagabbnak tartott területe...
Hatalmas vihart kavart az Egyesült Államokban, hogy egy szövetségi esküdtszék illegális monopóliumnak minősítette a Live Nationt és leányvállalatát, a Ticketmastert...