Az MI még mindig naiv: nem tud különbséget tenni tény és vélemény között

A legújabb kutatások szerint a mai nagyméretű nyelvi modellek, mint a GPT-4o, még mindig komoly gondban vannak azzal, hogy megkülönböztessék a tényeket az emberi hiedelmektől – főleg, ha a hiedelem hamis. Ez jelentősen növeli a téves információk terjedésének kockázatát.

Hibás döntések a fontos területeken

A Stanford Egyetem kutatói 24 népszerű MI-modellt teszteltek, több mint 13 ezer kérdésre adott válaszaikat vizsgálva. Kiderült, hogy az újabb modellek – például a 2024 májusában megjelent GPT-4o – 34 százalékkal kevésbé ismerték fel a hamis hiedelmeket, mint a valósakat. A régebbi modelleknél ez az arány még rosszabb volt: ott 39 százalékos különbséget találtak. A modellek a tények felismerésében is eltérően teljesítettek: az újabbaknál 91 százalékos pontosságot mértek, a régebbieknél csak 72–85 százalék közöttit.

Felületes gondolkodásmód és veszélyes hiányosságok

A vizsgált modellek nem valódi tudásra vagy logikus helyzetfelismerésre támaszkodnak, inkább mintázatokat ismernek fel – ez könnyen félrevezetheti az embereket. Különösen olyan területeken, ahol a pontatlan MI-válasz emberi életeket, illetve jogi vagy tudományos eredményeket befolyásolhat.

Az MI mindenhol ott lesz, akkor is, ha hibázik

Idén világszerte közel 555 billió forintot (1,5 billió dollárt) költenek MI-fejlesztésre – jósolja a Gartner elemzőcég. Az MI nemcsak a telefonokban vagy autókban, hanem a kenyérpirítókban és a streaming-szolgáltatásokban is megjelenik. Az elterjedést egyelőre nem akadályozzák a hibák, pedig például az MI-alapú ügyfélszolgálatok erősen alulteljesítenek, és a titoktartás jelentőségét sem értik.

2025, adrienne, go.theregister.com alapján

Share on Social Media

Az MI még mindig naiv: nem tud különbséget tenni tény és vélemény között

Hibás döntések a fontos területeken

Felületes gondolkodásmód és veszélyes hiányosságok

Az MI mindenhol ott lesz, akkor is, ha hibázik

Legfrissebb posztok

Az újabb bitcoin-zuhanás: 100.000 dollár alatt vagyunk

Az Apple végre webre költözteti az App Store-t, de ne örülj túl korán

Újabb WordPress-fiaskó: veszélyben a JobMonster adminjogok

Az amerikai DJI drónstop közelebb van, mint gondolnánk

Az új Coca-Cola ünnepi reklám: MI-generált nosztalgia, lélek nélkül

Az új Windows Server-frissítés tönkretette a hotpatch-t

Az óriási gázerőműből hidrogénes jövő: Los Angeles nagy dobása

Az Antarktisz meghökkentő jégolvadása: soha nem látott visszahúzódás

Az új Nintendo Switch 2 letarolja az eladásokat

Az OpenAI gigászi, 13 ezermilliárd forintos felhőbizniszt kötött az Amazonnal

Megoldja az okostelefon a kiégést? Az MI tényleg segíthet

Összeomlott az 56 milliárd dolláros segélyrendszer

Egy trükkel előhívhatjuk az elfeledett gyermekkori emlékeket

Az új Google Fordító okosabb, de lassabb lett

Az év legnagyobb és legfényesebb szuperholdja jön

Egy ősi hal hallása meglepte a tudósokat

Az Amazonas védelme rekordcsökkenést hozott a brazil kibocsátásban

Az MI-piacokon még bőven akadnak meglepetések

Az ingyenes MI és India: ki húz hasznot belőle?