MI vs. Super Mario: Az örökkévaló játék lett az új teljesítménymérő
Új ötlet van terjedőben: a Super Mario-t használják a mesterséges intelligencia teljesítményének mérésére. Egy kutatócsoport szerint a Super Mario Bros. mégnagyobb kihívást jelent, mint gondolnánk.
A Kaliforniai Egyetem San Diego campusán működő Hao AI Lab pénteken élő Super Mario Bros. játékokba vetette az MI-ket. Az Anthropic Claude modellje teljesített a legjobban, majd a Claude 3.5 következett. A Google és az OpenAI modelljei gyengébben szerepeltek.
Nem egészen a klasszikus játék
Fontos tisztázni, hogy ez nem pontosan az eredeti 1985-ös kiadás volt. A játék egy emulátorban futott, és egy keretrendszerrel integrálták, hogy az MI-k irányíthassák Mariót.
A Hao által házon belül fejlesztett GamingAgent alapvető utasításokat adott az MI-nek, például: “Ha akadály vagy ellenség van a közelben, mozdulj/ugorj balra, hogy elkerüld”, valamint játékbeli képernyőképeket mutatott. Az MI ezután Python kódban generált bemeneti parancsokat Mario irányításához.
Meglepő eredmények
A Hao szerint a játék arra kényszerítette a modelleket, hogy “megtanuljanak” összetett manővereket tervezni és játékstratégiákat kidolgozni. Érdekes módon a kutatólabor azt találta, hogy az OpenAI-hoz hasonló, következtető modellek, amelyek lépésről lépésre “gondolkodnak” a problémák megoldása során, rosszabbul teljesítettek, mint a “nem következtető” modellek, annak ellenére, hogy általában erősebbek a legtöbb teljesítménymérőn.
A kutatók szerint az egyik fő oka annak, hogy a következtető modelleknek gondot okoz a valós idejű játékok játszása, az, hogy időbe telik – általában másodpercekbe -, mire döntést hoznak. A Super Mario Bros. játékban pedig minden a megfelelő időzítésen múlik. Egy másodperc lehet a különbség egy biztonságosan végrehajtott ugrás és a halálba zuhanás között.
A játékokat már évtizedek óta használják az MI teljesítményének mérésére. Azonban kétséges az MI játékban mutatott képességei és a technológiai fejlődés közötti összefüggések megítélése. A való világgal ellentétben a játékok általában elvontak és viszonylag egyszerűek, valamint elméletileg végtelen mennyiségű adatot biztosítanak az MI betanításához.
Nincsenek igazán jó mérőszámokat az MI-k összehasonlítására.
De legalább nézhetjük, ahogy az MI Mariót játszik.
🤔 Elon Musk komolyan harcba száll az OpenAI ellen, és most újra rátett egy lapáttal: ha megkapná azt a fenséges 150 milliárd dolláros (azaz 54 ezermilliárd forintos) kártérítést, nem engedné a saját zsebébe csorogni...
A tavalyi év minden eddiginél súlyosabb volt az Egyesült Államokban a digitális csalások területén: a veszteségek meghaladták a 21 milliárd dollárt (körülbelül 7800 milliárd forintot)...
A Sony új, Bravia True RGB Mini LED technológiával rukkolt elő, amellyel minden eddiginél élénkebb színeket és nagyobb fényerőt ígér a házimozi-szerelmeseinek...
Kezdetben csupán célzott próbálkozásoknak tűntek az iráni kibertámadások, de mostanra a támadók fokozott lendülettel vették célba az Egyesült Államok legkritikusabb infrastruktúráját...
Az űrkutatás történetében ritka pillanatnak lehettünk tanúi: az Artemis II legénysége minden eddiginél távolabb jutott a Földtől, amikor az Orion űrhajó megkezdte holdkerülő repülését a Hold túlsó oldala felett...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. VestClaw (iPhone/iPad)A VestClaw egy innovatív befektetési alkalmazás, amely gördülékennyé és érthetővé teszi a befektetések világát...
😱 Ilyen, amikor valaki végre rálel egy olyan alkalmazásra, amely az egész filmet nyomon követi, és még a horrorjelenetek előtt is szól, ha közeleg egy hirtelen ijesztés...
Mostantól minden eddiginél könnyebb lesz a játékvezérlőket testre szabni Androidon. Az Android 17 béta elhozta a natív kontroller-átkiosztás funkciót, amellyel egyszerűen lehet egyedi gombkiosztásokat készíteni: tetszés szerint átvariálhatók a gombok, karok és ravaszok működése, méghozzá rendszerszinten...
Az AI-RAN, vagyis a mesterséges intelligenciával működő rádiós hálózat teljesen új dimenziót nyit a vezeték nélküli vállalati infrastruktúrák világában...
🔍 A világ egyik legnagyobb szervergyártója, a Supermicro, nagyszabású belső vizsgálatot indított, miután a cég egyik társalapítóját, Yih-Shyan Wally Liaw-t azzal vádolták meg, hogy több milliárd dollár értékű, Nvidia grafikus gyorsítókkal felszerelt szervereket csempészett Kínába, megsértve az amerikai exportkorlátozásokat...
🚦 Egy kínaiul beszélő hackercsoport, a Storm-1175, elképesztő gyorsasággal képes vállalatok és szervezetek teljes rendszereit feltörni, adatokat ellopni, majd zsarolóvírust bevetni...
📦 Egy lényeges szempont, hogy a felhőalapú vállalati adatok zöme ma már objektumtárolókban, elsősorban az Amazon S3-ban található, miközben az MI-alapú ügynökök és fejlesztők továbbra is hagyományos fájlrendszerekben gondolkodnak...
Az Oregon State University kutatói korszakalkotó felfedezést tettek az Alzheimer-kór vizsgálatában: sikerült élőben megfigyelni, valójában hogyan károsítja sejtszinten az agyat a betegség...
🎮 Ha már untad, hogy a Vision Pro (az Apple vegyes valóságú headsetje) csak almás tartalmakat engedett, most jön a nagy fordulat: kapaszkodj, mert a Valve végre kihozta a natív Steam Link appot a Vision Próra!..
📷 Az X újabb fejlesztései révén sokkal többet hoz ki a beépített fotószerkesztőből: az MI-alapú Grok segítségével már egyszerű, beszélgetős utasításokkal lehet képeket szerkeszteni, továbbá lehetőség nyílik arcok elhomályosítására és feliratok elhelyezésére is...