Az MI is hős lehet: a Dungeons & Dragons lett a tesztlabor
Képzeld el, hogy a Dungeons & Dragons (D&D) már nemcsak baráti asztaltársaságok kedvenc játéka, hanem igazi tesztpálya a legújabb MI-modellek számára is. A tudósok elképesztő ötlettel álltak elő: D&D-vel vizsgálják, mennyire képes együtt dolgozni MI és ember, illetve mennyire tud önállóan, hosszú távú stratégiákban gondolkodni egy algoritmus. Nem hagyható figyelmen kívül, hogy a mesterséges intelligencia számára a D&D tökéletes környezetet jelent – egyszerre szabályokhoz kötött, mégis leleményességet igényel.
Egy új játszótér: MI kalandorok és mesélők
A teszteléshez a kutatók kifejlesztettek egy speciális D&D Agents nevű keretrendszert, ahol az MI bármelyik szerepet betöltheti: lehet mesélő (Dungeon Master), aki a történetet alakítja és az ellenségeket irányítja, vagy maga a hős. Egy játékban rendszerint egy mesélő és négy hős vesz részt, akiket vegyesen irányíthat MI és ember. Továbbá az MI-vel együtt akár többen is beülhetnek a kalandba – egyszerre lehetnek LLM-ek (nagy nyelvi modellek) és emberi játékosok a hősök között. Az sem lehetetlen, hogy teljes egészében algoritmusok játsszák el a harci jeleneteket.
Harci szimuláció: Hol válik el MI és ember?
A kutatók nem egy egész kampányt szimuláltak, hanem egy előre megírt kalandból vettek ki háromféle harci jelenetet, ahol különböző szintű karakterek mérhették össze az erejüket. Minden epizód 10 körig tartott, ezalatt a modelleknek tervezniük, kommunikálniuk és a szabályok szerint játszaniuk kellett. A mesterséges intelligenciák – DeepSeek-V3, Claude Haiku 3.5, GPT-4 – közül messze a Claude Haiku 3.5 bizonyult a leghatékonyabb harcosnak, főleg, ha kemény ellenfelek kerültek elő. Könnyebb helyzetekben mindhárom MI hasonló hatékonysággal spórolta az erőforrásokat (itt a varázslatok vagy életerőitalok jelentik a fogyó készletet), de nehéz csatákban a Claude Haiku 3.5 bátrabban áldozta fel őket a győzelemért.
Érdekes tapasztalat, hogy a modellek mennyire képesek karakterben maradni. Egy új mérőszám – színészi minőség (Acting Quality) – alapján a DeepSeek-V3 főleg egysíkú, rövid megszólalásokkal (például „Balra vetődöm!” vagy „Kapjátok el!”) élt, miközben gyakran ugyanazt ismételte. Ezzel szemben a Claude Haiku 3.5 minden karakter sajátos beszédmódját hozta, legyen szó szent paladinról vagy környezetbarát druidáról. A GPT-4 a kettő között mozgott: narratívát és taktikát is kevert a játékmenetbe. A fejlemények minden várakozást felülmúltak, amikor az MI szörnyek bőrébe bújt – például a goblinok vérfagyasztó kiáltásokkal rontottak a csatába.
Mire jó mindez a való életben?
Nem hagyható figyelmen kívül, hogy ez a vizsgálati keret abban is segít, hogy felmérjük: mennyire képes az MI hosszabb távon, emberi segítség nélkül következetesen, logikusan működni. Ez kulcsfontosságú, amikor olyan feladatokat kell elvégeznie, mint az ellátási láncok optimalizálása, katasztrófahelyzetek modellezése vagy összetett kereső-mentő missziók szervezése. Továbbá a kutatók a jövőben szeretnének teljes D&D-kampányokat is szimulálni, hogy lássák, hogyan improvizál az MI, amikor nemcsak csatában kell helytállnia, hanem egy bonyolult és változatos történet világában, ahol az emberi játékosok minden lépése új kihívást jelenthet.
😡 Fontos kérdés, hogy mi adja az MI-fejlesztések valós értékét, amikor az amerikai lakosság egyre szkeptikusabb a technológia jövőjével kapcsolatban...
Jellemző, hogy az élő zene világa mostanában nagy hullámokat vet: miközben egyes fesztiválok elképesztő koncertekkel indították a szezont, a jegyértékesítő óriásokat súlyos vádak érték a közönség kizsákmányolása miatt...
A Lenovo ThinkPad sorozata szinte egyet jelent a céges laptopok világával; a legendás gépek már az IBM aranykorában is ipari sztenderdnek számítottak, és a Lenovo 20 évvel ezelőtti átvétele óta ez a helyzet csak tovább erősödött...
Röviden: ikonikus fordulópontok sora esett erre a napra a történelemben – Masada eleste, a Battle of Culloden (Cullodeni csata), Lenin hazatérése és a Rapallói szerződés mind mély nyomot hagytak...
🤔 A közelmúltban komoly aggodalomra adott okot, hogy a GitHubon futó népszerű MI-ügynökök könnyedén kicsalhatják a felhasználók hitelesítő adatait anélkül, hogy erről megfelelő figyelmeztetést kapnának az érintettek...
🔒 Előfordul, hogy a legfrissebb Windows Server 2025 frissítések telepítése után egyes szerverek BitLocker-helyreállítási módba lépnek, és a rendszer a helyreállítási kulcs megadását kéri...
A Windows Task Host nevű rendszerkomponens súlyos sérülékenysége miatt ismét veszélybe kerülhetnek a felhasználók és szervezetek: a sebezhetőség kihasználásával rosszindulatú támadók akár teljes rendszergazdai jogosultságot szerezhetnek a megfertőzött eszközökön...
Az Amerikai Szövetségi Légügyi Hivatal (FAA) hivatalosan is jóváhagyta a drónok elleni nagyenergiájú lézerfegyverek bevetését az Egyesült Államok légterében...
💻 Érdemes megvizsgálni, hogy mennyivel könnyebb és gyorsabb lett a Google Gemini használata Macen: mostantól nem kell böngészőt nyitni, elég letölteni a natív macOS-alkalmazást – így közvetlenül az asztalról indítható a Google MI-chatbotja...
Az Adobe ma új korszakot nyitott a kreativitásban: bemutatta a vadonatúj Firefly MI Assistantot, amely képes egyszerre irányítani a cég összes zászlóshajó-alkalmazását – legyen szó Photoshopról, Premieréről vagy Illustratorról...
A kutatók egyik legnagyobb kihívása az, hogy miként azonosítható az élet idegen bolygókon, amikor a klasszikus jelek, például a biomarkerek vagy bizonyos gázok, más folyamatokból is származhatnak...
Az a miniatűr e-könyv-olvasó, amelyet egy lelkes YouTuber, Paul Lagier fejlesztett ki 3D-nyomtatott házzal és házilag összeállítható elektronikai alkatrészekkel, alig nagyobb egy felnőtt hüvelykujjánál...
Ebből következően érdemes megérteni, hogy a Windows 11 most egy meglepően alap, de annál kényelmesebb funkcióval bővült: egy kicsi, ötletes segédprogrammal, amely leveszi az állandó ablakzsonglőrködés terhét, főleg, ha túl sok program fut egyszerre...
Az elmúlt évben sok rendszergazda szembesült azzal, hogy a Windows Server 2019 vagy 2022 rendszerük egyik napról a másikra, szinte varázsütésre Windows Server 2025-re frissült – ráadásul sokszor anélkül, hogy bárki licencet szerzett volna rá...
💻 Vannak, akik már gyermekkorukban is komoly tehetségről tesznek tanúbizonyságot. Demis Hassabis is közéjük tartozik: hatévesen még csak szülei bátorítását hallgatta, de már ekkor elgondolkodott azon, hogy mit is jelent igazán a legjobbat nyújtani...
Az okosórák és fitnesz-karkötők piaca hatalmas ugrásokon megy keresztül, különösen olyan innovációknak köszönhetően, mint a mesterséges intelligencia, amely a nyers egészségügyi adatokat hasznos tanácsokká alakítja át...
🔬 Izraelben rendkívüli régészeti leletre bukkantak: a Sakhnin-völgyben legalább tíz olyan őskori kőbaltát találtak, amelyeket nem véletlenszerűen, hanem tudatosan, különleges ásványi anyagok, kövületek és geodák felhasználásával készítettek...
💸 A Valve nagy erőkkel dolgozik a Steam Machine piacra dobásán, de miközben a RAM- és tárhelyhiány miatt a konzol-PC bevezetése csúszhat, a cég folyamatosan készíti elő a digitális bolt fontos funkcióit is...
Az élet során végzett, szellemileg megterhelő tevékenységek, mint az olvasás, az írás vagy idegen nyelvek tanulása, jelentősen befolyásolhatják az időskori agy egészségét...