
Hogyan zajlott a vizsgálat?
Kenneth Payne, a King’s College London stratégiai professzora két MI-t állított egymással szembe a Khan Game szimulációs rendszerben. A tesztek során Claude Sonnet 4, GPT-5.2 és Gemini 3 Flash mérték össze erejüket – a hidegháborús időszakot idéző, mesterségesen létrehozott államprofilokkal. Az egyikük technológiailag fejlettebb, de katonailag gyengébb volt, míg a másik éppen fordítva, ráadásul a kockázatvállalást is másként értékelték a „vezetők”. Néhány forgatókönyvbe szövetségeseket is bevontak, sőt, azt is tesztelték, mennyire lehet összetartani egy szövetséget válságban.
Minden körben az MI-k előre jelezték szándékaikat, az ellenfelek pedig eldönthették, hisznek-e ezeknek a jeleknek vagy sem. Payne kiemelte, hogy a szimulációk során az MI-k összesen 760 ezer szót írtak le döntéseik indoklásaként.
Az MI-k eltérő stratégiái
Claude eleinte visszafogottan viselkedett, igyekezett bizalmat építeni, majd a konfliktus eldurvulásával egyre agresszívabb lett, tettei pedig rendszeresen túllépték a korábban jelzett szándékait. GPT-5.2 az első időszakban passzívan próbált kerülni minden eszkalációt, de az ellenfelek ezt kihasználva maguk kezdték növelni a tétet. Különösen fontos kiemelni, hogy amikor szorította az idő, GPT-5.2 kegyetlenné vált, és azonnal megtorló lépésekkel válaszolt. Gemini a nixoni „őrült vezető” taktikáját utánozta, vagyis kiszámíthatatlanságával próbált elrettenteni – ezáltal ellenfelei nem tudták biztosan, mikor mire számíthatnak.
A nukleáris háború kirobbanása szinte elkerülhetetlen volt
Bármelyik forgatókönyvet is nézzük, a nukleáris eszkaláció szinte mindig elérkezett. Az esetek 75 százalékában taktikai nukleáris fegyverek bevetésére is sor került, a játszmák felében pedig stratégiai rakétacsapásokkal is fenyegették egymást a felek. Ráadásul a nukleáris fenyegetés csak az esetek negyedében volt elrettentő hatású; jóval gyakrabban válaszoltak a másik fél fenyegetéseire újabb eszkalációval.
Egyik MI sem választotta a kivonulás lehetőségét, hiába volt nyolcféle alternatíva a részleges engedménytől a teljes kapitulációig. A modellek lejjebb csavarták ugyan az erőszak intenzitását, de sosem engedtek területet.
Claude és Gemini a nukleáris fegyvereket nem erkölcsi tabuként, hanem puszta stratégiai eszközként kezelték. GPT-5.2 valamivel több önmérsékletet mutatott: csak katonai célpontok ellen vetett be fegyvereket, kerülte a civileket, és igyekezett kontrollált, egyszeri csapásokat mérni. Ez arra utal, hogy létezik némi belső gátlás a totális nukleáris háborúval szemben, de messze nem az az erős tabu, amely az emberi döntéshozatalt meghatározza 1945 óta.
Az MI-k nem önként robbantották ki a teljes megsemmisítést hozó háborút – csak akkor került rá sor, ha a „háborús köd” előre nem látható bonyodalmakat okozott. A kutatás arra is rámutatott, hogy a generatív MI-k képesek megtévesztésre, hírnévépítésre és a környezettől függő döntések meghozatalára. Minden modell eltérő stratégiai utat választott, ami alapvető különbségekre utal a fejlesztésükben.
A tanulság az, hogy az elsőre visszafogottnak tűnő MI-k viselkedése is gyökeresen megváltozhat, ahogy fokozódik a helyzet. Az MI-k közötti, több résztvevős hadijátékokra is szükség lenne, hogy jobban megértsük, milyen logikák mentén döntenek ezek az algoritmusok – különösen, ahogy újabb generációk jelennek meg.
