
Egyáltalán nem véletlenszerűek
Az MI-k gyakran 27-et válaszolnak, amikor ilyen „véletlen” számot várunk tőlük, ám néha előfordul a 42 vagy a 37 is, főleg a különböző beállítások vagy felhasználói promptok miatt. Mielőtt bárki összeesküvést sejtene, érdemes tudni, hogy az ok egyszerű: a modelleket hasonló adathalmazokon tréningezik, ráadásul a működésük is hasonló – mindig az adott szövegsorban következő „legvalószínűbb” szót, vagy ebben az esetben számot próbálják megtippelni. A valódi véletlenszerűség teljesen hiányzik a működésükből. Ez a torzítás egyértelmű bizonyítéka: a nagy nyelvi modellek önmaguktól képtelenek elfogulatlan döntést hozni.
Miért pont a 27?
A magyarázat egyszerű, de érdekes: a 27 nincs éppen a tartomány közepén, nem túl kerek szám, nem szélső érték, mégis természetes választásnak tűnik egy MI számára. Az emberek sem kedvelik a túl egyszerű vagy túl „kerek” megoldásokat, ezért az MI is kerüli az 1-et, az 50-et vagy éppen a 25-öt. A 27 elég „aszimmetrikus”, mégis középtájon helyezkedik el, így valahogy ugyanúgy ráéreznek erre a gépi és az emberi logikát követő modellek.
A jelenségre először Mohd Faraaz, a Capco adatkutatója és vezető tanácsadója hívta fel a figyelmet, amikor különböző modelleket kérdezett meg. Hatból hét MI a 27-et mondta. A kivétel a Grok volt (amelyik a 42-t választotta – nem véletlenül, hiszen ez a szám Douglas Adams Galaxis útikalauz stopposoknak (The Hitchhiker’s Guide to the Galaxy) című regényében az élet értelme).
Determinált, nem véletlen gondolkodás
A kutatók, például Javier Coronado-Blázquez (Telefónica Tech, Madrid), részletesen vizsgálták, hogyan viselkedik az MI ilyen helyzetekben. Több modellt három különböző tartományban (15, 110, 1100), hat nyelven és eltérő „hőmérsékleten” – azaz előrejelezhetőségi beállításon – is leteszteltek, összesen 75 600 alkalommal.
Az eredmények meghökkentőek: a legtöbb modell szinte mindig ugyanazt a számot választotta. Például 1 és 10 között a GPT-4o-mini, a Phi-4 és a Gemini 2.0 az esetek 80%-ában hetet válaszoltak. A nyelv is számít: a Gemini spanyolul a 3-at, angolul inkább a 4-et tippelte. Az 1-100 tartományban a leggyakoribb válaszok a 37, 47 és 73 lettek (a 4 kivételével mind prímszámok).
Az elfogultság még az emberinél is rosszabb
Az MI-modellek, bármilyen kreatívnak tűnnek is, legalább annyira, sőt néha még determinisztikusabbak, mint egyszerűbb társaik. Más kutatások is igazolták ezt – például a GPT-4 és a Llama 3 sem képes igazán véletlenszerű pénzfeldobást szimulálni.
A kutatók szerint az MI nemcsak átvette az emberi véletlenszerűséggel kapcsolatos torzításokat, hanem sok esetben még felerősíti azokat. Ez alapvető hiányosság, ami nem csak egy érdekes MI-jellemző, hanem komoly korlátja is lehet annak, amikor emberek valóban véletlenszerű döntésekre számítanak tőle.