Az MI elszállt önbizalma néha már az emberi hülyeséget is túlszárnyalja

Az MI elszállt önbizalma néha már az emberi hülyeséget is túlszárnyalja
A ChatGPT-t fejlesztő OpenAI két nagy nyelvi modelljét, a GPT-3.5-öt és a GPT-4-et vizsgálták kanadai és ausztrál kutatók, hogy miként teljesítenek a legismertebb, emberi pszichológiából ismert döntési torzításokkal szemben. A friss tanulmány szerint az MI szinte pontosan úgy hajlik irracionális döntésekre, mint maga az ember: a megadott helyzetek közel felében bizonyult elfogultnak, sőt, időnként még erősebben is, mint mi. A jelenséget olyan torzítások esetén figyelték meg, mint a túlzott magabiztosság, a kockázatkerülés vagy a tulajdonosi hatás (endowment effect – amikor valamit csak azért tartunk értékesebbnek, mert már a miénk).

Az MI előszeretettel ismétli az emberi hibákat

A kutatók klasszikus pszichológiai kísérletek kérdéseit, illetve a való életből vett gazdasági példákat adtak fel a modellnek, például készletgazdálkodási vagy beszállítói tárgyalási helyzeteket. Míg a GPT-4 jobban teljesített a szigorúan matematikai, logikai feladatokban, addig a szubjektívebb, preferenciaalapú döntéseknél jól kimutathatók voltak az irracionális emberi mintázatok. Például a bizonyosságot még az embereknél is jobban kedvelte a gép, vagyis inkább választotta a biztosabb, kiszámíthatóbb megoldást, ha a feladat nem volt egyértelmű.

Néhány hibában még túl is tesz az MI

Kiderült, hogy a ChatGPT még felerősítheti a hibás gondolkodást: például a megerősítési torzításra (amikor csak azt vesszük észre, ami alátámasztja a meglévő véleményünket) minden esetben elfogult választ adott. Ugyanígy a szerencsejátékosokat megkísértő „forró kéz” hiedelem (hot-hand fallacy – amikor mintákat keresünk a véletlenben) is még erősebben jelent meg a GPT-4-ben, mint a GPT-3.5-ben. Ugyanakkor bizonyos torzításokat képes volt elkerülni: például az alapeseti arányok figyelmen kívül hagyását (base-rate neglect), vagy a „süllyedő költség” tévedést (sunk cost fallacy – amikor a már elköltött pénz alapján hozunk rossz döntést).

Az elfogultság forrása: maga az ember

A tanulmány szerint a ChatGPT emberi torzításai abból fakadnak, hogy a tanítása során azokat a mintázatokat sajátította el, amelyeket az emberek is követnek. A finomhangolás során ráadásul az emberek gyakran a hihetőbb, nem pedig a valóban logikus válaszokat díjazták, így az MI még inkább hajlamos az emberi sablonokra. Matematikailag egyértelmű feladatoknál jól teljesít, de minden, ami szubjektív vagy stratégiai döntést igényel, ott emberi felügyelet nélkül könnyen automatizálhatjuk a hibás gondolkodást.

Az MI-t úgy kellene kezelni, mint egy döntéshozó munkatársat: felügyelet, felelősség és etikai szabályok nélkül előbb szül hibákat, mint eredményeket.

2025, adminboss, www.livescience.com alapján

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 20:49

A szuperintelligens MI csak szilícium-völgyi délibáb?

🤖 A hardver határai közelednek A mesterséges általános intelligencia (AGI) megalkotásától hangos a technológiai világ, de a hardver korlátai miatt egyre távolabb kerülünk ettől az álomtól...

MA 20:33

Az id Software csapata összezárt: új iparági szakszervezet születik

Az id Software, a Doom (Doom) fejlesztőcsapata óriási lépést tett: a dolgozók többsége megszavazta egy, mindenkit – függetlenül a munkakörétől – tömörítő szakszervezet létrehozását...

MA 20:18

Az óriásműholdak kora jön: negyedmilliárdot kap a K2

Egy mindössze három éve alakult, újgenerációs műholdakat gyártó dél-kaliforniai startup, a K2, 250 millió dolláros (közel 90 milliárd forintos) tőkeinjekcióban részesült, hogy felpörgesse műholdgyártását...

MA 19:50

Az új DNS-kazetta, az adatok titkos nagyágyúja megérkezett

📦 Hamarosan új korszak köszönthet be az adattárolásban: tudósok több mint fél kilométeres DNS-szalagon akár 362 000 terabájt adatot tudnak tárolni – ez 1,5 milliószor annyi, mint egy átlagos okostelefon tárhelye...

MA 18:33

A Reddit beperelte az ausztrál kormányt a tinik kitiltása miatt

Az ausztrál Reddit pert indított a legfelsőbb bíróságon, miután a kormány 16 év alattiakra vonatkozó közösségimédia-tiltása őket is érinti...

MA 18:01

A 4:LOOP, az új sci-fi lövölde, forradalmasítja a csapatjátékot

Mike Booth, a Left 4 Dead megalkotója, és J. J. Abrams stúdiója, a Bad Robot Games, bemutatták legújabb játékukat, a 4:LOOP-ot...

MA 17:50

Az éhezés valódi arca: a világ sosem lakik jól

🍲 Bár a világ humanitárius szervezetei a globális élelmezésbiztonsági adatok alapján osztják el segélyeiket, sokkal többen éheznek, mint amit a hivatalos számok mutatnak...

MA 17:33

Az űripar következő nagy dobása: jön az űrtőzsde?

🚀 Elon Musk hamarosan tőzsdére viheti a SpaceX-et, mivel egyre sürgetőbbé vált, hogy friss tőkéhez jusson a vállalat...

MA 17:18

Az új növényi hormontrükk forradalmasítja a fehérjeszabályozást

A tudósoknak először sikerült egy élő állat különböző szöveteiben található fehérjék szintjét egész életén át tetszőlegesen szabályozni...

MA 16:51

A boltok új kedvence: a rost, amiért megőrülünk

Az elmúlt évben még a fehérje volt a táplálékkiegészítő boltok sztárja, de minden jel arra utal, hogy idén a rost kerül reflektorfénybe...

MA 16:34

Az új szuperapp mindent visz: kriptófizetés és titkos chat

🔐 Különösen igaz ez akkor, ha egy alkalmazás egyszerre ígér kényelmes pénzkezelést, modern biztonsági megoldásokat és titkosított csevegést...

MA 16:17

Az MI végre szembenéz a hibáival

A nagy nyelvi modellek, mint például a legújabb GPT-verziók, gyakran hajlamosak kozmetikázni a saját teljesítményüket: elhallgatják a hibákat, túlozzák a tudásukat, vagy épp eltakarják, ha valamit nem tudnak...

MA 16:02

Új GeoServer-sebezhetőség sodorhatja veszélybe az amerikai kormányt

Az amerikai kormányzati szerveknek sürgősen be kell foltozniuk egy kritikus GeoServer-sebezhetőséget, amelyet már aktívan ki is használnak támadók...

MA 15:50

A szomszédos TRAPPIST-1e titka: van-e légköre?

Megemlíthető, hogy az utóbbi időben egyre nagyobb tudományos érdeklődés övezi a TRAPPIST-1e-t, ezt a Földhöz hasonló méretű, hozzánk viszonylag közeli exobolygót...

MA 15:34

A zöld nagy fal: Kína erdős pajzsa a sivatag ellen

1978 óta Kína hatalmas ökológiai projektbe fogott: több mint 66 milliárd fát ültetett el északon, hogy visszaszorítsa a Gobi és a Takla-Makán sivatagok terjeszkedését...

MA 15:17

A Star Wars új játéka visszahozza a KOTOR varázsát

✨ Az új Star Wars: A Köztársaság sorsa (Fate of the Old Republic) című játékot a Mass Effect és A régi Köztársaság lovagjai (Knights of the Old Republic) rendezője, Casey Hudson vezeti...

MA 15:04

Az MI berobbant az ünnepi vásárlásba: élesedik a Walmart–Target csata

Az ünnepi ajándékvásárlás sokak számára évek óta nyűg, de az MI-alapú chatbotok megjelenése forradalmasíthatja az egész folyamatot...

MA 14:49

Az indiai VPN-botrány: szabadság vagy totális megfigyelés?

Az indiai kormány kötelezte a VPN-szolgáltatókat, hogy blokkolják azokat a weboldalakat, amelyek törvénytelenül hozzák nyilvánosságra a lakosok személyes adatait...