MA 19:56

Az MI is hős lehet: a Dungeons & Dragons lett a tesztlabor

Az MI is hős lehet: a Dungeons & Dragons lett a tesztlabor
Képzeld el, hogy a Dungeons & Dragons (D&D) már nemcsak baráti asztaltársaságok kedvenc játéka, hanem igazi tesztpálya a legújabb MI-modellek számára is. A tudósok elképesztő ötlettel álltak elő: D&D-vel vizsgálják, mennyire képes együtt dolgozni MI és ember, illetve mennyire tud önállóan, hosszú távú stratégiákban gondolkodni egy algoritmus. Nem hagyható figyelmen kívül, hogy a mesterséges intelligencia számára a D&D tökéletes környezetet jelent – egyszerre szabályokhoz kötött, mégis leleményességet igényel.

Egy új játszótér: MI kalandorok és mesélők

A teszteléshez a kutatók kifejlesztettek egy speciális D&D Agents nevű keretrendszert, ahol az MI bármelyik szerepet betöltheti: lehet mesélő (Dungeon Master), aki a történetet alakítja és az ellenségeket irányítja, vagy maga a hős. Egy játékban rendszerint egy mesélő és négy hős vesz részt, akiket vegyesen irányíthat MI és ember. Továbbá az MI-vel együtt akár többen is beülhetnek a kalandba – egyszerre lehetnek LLM-ek (nagy nyelvi modellek) és emberi játékosok a hősök között. Az sem lehetetlen, hogy teljes egészében algoritmusok játsszák el a harci jeleneteket.

Harci szimuláció: Hol válik el MI és ember?

A kutatók nem egy egész kampányt szimuláltak, hanem egy előre megírt kalandból vettek ki háromféle harci jelenetet, ahol különböző szintű karakterek mérhették össze az erejüket. Minden epizód 10 körig tartott, ezalatt a modelleknek tervezniük, kommunikálniuk és a szabályok szerint játszaniuk kellett. A mesterséges intelligenciák – DeepSeek-V3, Claude Haiku 3.5, GPT-4 – közül messze a Claude Haiku 3.5 bizonyult a leghatékonyabb harcosnak, főleg, ha kemény ellenfelek kerültek elő. Könnyebb helyzetekben mindhárom MI hasonló hatékonysággal spórolta az erőforrásokat (itt a varázslatok vagy életerőitalok jelentik a fogyó készletet), de nehéz csatákban a Claude Haiku 3.5 bátrabban áldozta fel őket a győzelemért.

Szerepbe bújva: Az MI kitalálja magát

Érdekes tapasztalat, hogy a modellek mennyire képesek karakterben maradni. Egy új mérőszám – színészi minőség (Acting Quality) – alapján a DeepSeek-V3 főleg egysíkú, rövid megszólalásokkal (például „Balra vetődöm!” vagy „Kapjátok el!”) élt, miközben gyakran ugyanazt ismételte. Ezzel szemben a Claude Haiku 3.5 minden karakter sajátos beszédmódját hozta, legyen szó szent paladinról vagy környezetbarát druidáról. A GPT-4 a kettő között mozgott: narratívát és taktikát is kevert a játékmenetbe. A fejlemények minden várakozást felülmúltak, amikor az MI szörnyek bőrébe bújt – például a goblinok vérfagyasztó kiáltásokkal rontottak a csatába.


Mire jó mindez a való életben?

Nem hagyható figyelmen kívül, hogy ez a vizsgálati keret abban is segít, hogy felmérjük: mennyire képes az MI hosszabb távon, emberi segítség nélkül következetesen, logikusan működni. Ez kulcsfontosságú, amikor olyan feladatokat kell elvégeznie, mint az ellátási láncok optimalizálása, katasztrófahelyzetek modellezése vagy összetett kereső-mentő missziók szervezése. Továbbá a kutatók a jövőben szeretnének teljes D&D-kampányokat is szimulálni, hogy lássák, hogyan improvizál az MI, amikor nemcsak csatában kell helytállnia, hanem egy bonyolult és változatos történet világában, ahol az emberi játékosok minden lépése új kihívást jelenthet.

2025, adminboss, www.livescience.com alapján

  • Te engednél mesterséges intelligenciát a saját játékodba, vagy csak emberekkel játszanál?
  • Szerinted jobb, ha az MI önállóan dönt, vagy inkább mindig legyen emberi felügyelet?


Legfrissebb posztok

MA 20:55

Az MI-őrület felfalja a memóriát, szabadesésben a Qualcomm

💸 A Qualcomm részvényei 7%-ot estek, miután a vállalat aggasztó előrejelzést adott ki a memóriachip-hiány miatt...

MA 20:37

A legnagyobb olasz egyetem térdre rogyott: hackerek blokkolták rendszereit

Olaszország legnagyobb egyeteme, a római La Sapienza, nagyszabású kibertámadás áldozata lett, emiatt teljesen leálltak az oktatási intézmény informatikai rendszerei...

MA 20:19

Az igazi tét: a blokklánc a pénzügyeké, nem a játékoké

A Solana Alapítvány elnöke, Lily Liu szerint ideje, hogy a blokklánc visszataláljon eredeti küldetéséhez: a pénzügyi szektor megújításához...

MA 20:02

Az MI végre megért: a Voxtral Transcribe 2 forradalma

A párizsi székhelyű Mistral újabb lendületet adott az MI-harcmezőn: bemutatta a Voxtral Transcribe 2 nevű, teljesen nyílt forráskódú hangfelismerő modelljét...

MA 19:38

A hangalapú vezérlés az MI következő nagy dobása

🔈 Az MI világában új korszak kezdődhet: a hangalapú vezérlés átveheti az uralmat a megszokott érintőképernyős és szöveges interakció felett...

MA 19:20

Az igazság a hálóban lapul: mit rejtenek a felhőnaplók?

A digitális világ átalakulásával a cégek tömegesen költöznek a felhőbe, ám ez a lépés új biztonsági vakfoltokat teremthet...

MA 19:01

Az MI-forradalom csúcsán Mark Cuban bulizni küldi a világot

🎉 Mark Cuban, aki gyakran hangoztatja, hogy az MI a jövő, most váratlan fordulattal egy élő eseményeket szervező cégbe, a Burwoodlandbe fektetett...

MA 18:55

Az Nvidia az MI miatt parkolópályára teszi a gamer kártyákat

Az Nvidia jelentősen átrendezi a prioritásait: a legújabb RTX 50-es széria Super frissítése elmarad, és akár 2028-ig sem várható új RTX 60-as sorozat...

MA 18:37

Az új űrruha forradalmasítja a holdraszállást

🚀 Érdemes megvizsgálni, hogy a NASA 1972 óta először készül holdraszállásra, és ehhez a következő generációs űrruha is hamarosan bemutatkozik...

MA 18:19

Vége az AirDrop egyeduralmának: megérkezett az Android válasza

🚀 Végre elérkezett az, amire minden Android-felhasználó régóta vágyott: a Google hivatalosan is bejelentette, hogy a Quick Share és az AirDrop közötti átjárhatóság hamarosan már nemcsak a Pixel 10 modellek kiváltsága lesz...

MA 18:02

Az évszázad vérholdja márciusban érkezik

Március 3-án hajnalban ritka látványban lehet része azoknak, akik az Egyesült Államok nyugati felén és Észak-Amerika több pontján laknak: teljes holdfogyatkozás, vagyis vérhold látható majd az égbolton...

MA 17:38

Az ultravékony felület, amely kétszer is becsapja a fényt

Érdemes megérteni, hogy a legújabb optikai fejlesztésnek köszönhetően egy ultravékony metafelület segítségével már lehetséges a fényt két teljesen eltérő módon téríteni, fókuszálni és irányítani – úgy, hogy mindkét spin-csatorna függetlenül működik, mégis az egész színskálán stabil eredményt ad...

MA 17:19

Az MI-ügynökök felemelhetnek, vagy romba dönthetik az életed

🤖 A ChatGPT ma már kevés újdonságot nyújt ahhoz képest, ami a következő generációs MI-ügynökök fejlesztésében zajlik...

MA 17:02

A leépítési hullám már a 2009-esnél is durvább

📈 Az amerikai munkaerőpiac januárban olyat produkált, amire 15 éve nem volt példa: a vállalatok 108 435 dolgozótól váltak meg, ami 118%-os emelkedés az előző évhez képest és 205%-os növekedés decemberhez képest...

MA 16:37

A rejtélyes földalatti óriások formálják Földünk mágneses terét

Kutatások szerint mélyen a Föld felszíne alatt elképesztően nagy és forró kőzetstruktúrák rejtőznek, amelyek évmilliók óta befolyásolják bolygónk mágneses terének alakulását...

MA 15:55

Az ünnepek alatt bezuhantak a PS5‑eladások

📉 A Sony eddig világszerte 92,2 millió PlayStation 5‑konzolt szállított ki, azonban az ünnepi szezonban 16 százalékkal kevesebb PS5 talált gazdára, mint tavaly...

MA 15:39

Az Amazfit Active Max: tényleg a legjobb olcsó fitneszóra?

💪 Az olcsó, mégis megbízható okosórák között régóta vezető szerepet tölt be az Amazfit...

MA 15:19

A floridai partok felett táncoló felhőutcák: a hideg levegő játéka

Fagyos levegő lepte el az Egyesült Államok keleti részét, Florida partjainál pedig különleges, szemet gyönyörködtető felhősávok rajzolódtak ki a műholdképeken...

MA 15:02

A mesterséges intelligencia memóriaéhsége padlóra küldi az okostelefonos piacot és a Qualcommot

📶 A Qualcomm történelmi, 12,3 milliárd dolláros (kb. 4 375 milliárd forintos) negyedéves bevétellel zárt, főleg a prémium okostelefonoknak és az egyre népszerűbb okosszemüvegeknek, autóipari és IoT-termékeknek köszönhetően...

MA 14:01

A nagy NGINX-átverés: titokban eltérített szerverek

⚠ Egy új, kifinomult támadássorozatban hackerek sikeresen kompromittálnak NGINX-szervereket, hogy a felhasználói forgalmat titokban a saját háttér-infrastruktúrájukra irányítsák át...

MA 13:56

Az FBI is beletört a bicskája: kifogott rajtuk az Apple Lockdown mód

Érdekes felvetés, hogy még az Egyesült Államok Szövetségi Nyomozó Irodája (FBI) is kudarcot vallhat, ha egy újságíró iPhone-ját próbálja feltörni, köszönhetően az Apple által fejlesztett Lockdown módnak...

MA 13:39

A véralvadásgátlók életet mentenek – de súlyos vérzést okozhatnak

💉 Több mint 8 millió amerikai szed alvadásgátlót veszélyes vérrögök megelőzésére. Ennek ellenére ezek a gyógyszerek évente több százezer, komoly vérzéssel végződő esetért felelősek...

MA 13:03

A brutális Android 16 QPR3-frissítés a Pixel mobilokra érkezik

🔥 A március izgalmas újdonságokat hoz a Pixel telefonokra. Az Android 16 QPR3 nagy platformfrissítése hamarosan elérhető lesz, ráadásul ezúttal nem csupán apró biztonsági javításokra, hanem valóban látványos, a napi használatot érintő változásokra számíthatnak a felhasználók...

MA 12:55

Az agy megtéveszti az immunrendszert: a tüdőrák titkos fegyvere

🧠 A tüdőrák évtizedek óta csak a kontrollt vesztett sejtosztódás hibájaként szerepelt az orvosi gondolkodásban, de friss kutatások feltárták: a daganatok aktívan kommunikálnak az aggyal, hogy kijátsszák az immunrendszert...

MA 12:37

Az MI felforgatja az ügyvédi irodák mindennapjait

Felmerül a kérdés, hogy egy MI-alapú startup hogyan képes átformálni egy olyan hagyományos területet, mint az ügyvédi irodák piaca...

MA 12:19

A Substack adatbotránya: kiszivárogtak a felhasználói adatok

Októberben súlyos biztonsági résen keresztül szivárogtak ki a Substack-felhasználóinak e-mail-címei és telefonszámai, ám a vállalat csak február elején észlelte az incidenst...

MA 12:02

Az egészséges Barry Manilow mégis halasztja Las Vegas-i koncertjeit

A 81 éves Barry Manilow sikeres műtét után kiválóan érzi magát, de orvosa tanácsára átszervezi közelgő Las Vegas-i koncertjeit, hogy maradéktalanul a felépülésre és az év eleji turnéjára tudjon koncentrálni...

MA 11:38

A pénztárcabarát, 12 portos 10GbE switch, ami felülmúl minden várakozást

💰 A Sodola SL-SWTGW2C48NS 12 portos 10GbE switch első ránézésre feltűnően olcsó, hiszen mindössze 84 000 forintért (230 USD) kínálják, sőt, egyes akciókkal akár 77 000 forintért is beszerezhető...

MA 11:19

Az Alphabet történelmet írt: a Google bevétele átlépte a 400 milliárd dollárt

🏆 A Google anyavállalata, az Alphabet idén először lépte át a 400 milliárd dolláros (kb...