Az MI elszállt önbizalma néha már az emberi hülyeséget is túlszárnyalja
A ChatGPT-t fejlesztő OpenAI két nagy nyelvi modelljét, a GPT-3.5-öt és a GPT-4-et vizsgálták kanadai és ausztrál kutatók, hogy miként teljesítenek a legismertebb, emberi pszichológiából ismert döntési torzításokkal szemben. A friss tanulmány szerint az MI szinte pontosan úgy hajlik irracionális döntésekre, mint maga az ember: a megadott helyzetek közel felében bizonyult elfogultnak, sőt, időnként még erősebben is, mint mi. A jelenséget olyan torzítások esetén figyelték meg, mint a túlzott magabiztosság, a kockázatkerülés vagy a tulajdonosi hatás (endowment effect – amikor valamit csak azért tartunk értékesebbnek, mert már a miénk).
Az MI előszeretettel ismétli az emberi hibákat
A kutatók klasszikus pszichológiai kísérletek kérdéseit, illetve a való életből vett gazdasági példákat adtak fel a modellnek, például készletgazdálkodási vagy beszállítói tárgyalási helyzeteket. Míg a GPT-4 jobban teljesített a szigorúan matematikai, logikai feladatokban, addig a szubjektívebb, preferenciaalapú döntéseknél jól kimutathatók voltak az irracionális emberi mintázatok. Például a bizonyosságot még az embereknél is jobban kedvelte a gép, vagyis inkább választotta a biztosabb, kiszámíthatóbb megoldást, ha a feladat nem volt egyértelmű.
Néhány hibában még túl is tesz az MI
Kiderült, hogy a ChatGPT még felerősítheti a hibás gondolkodást: például a megerősítési torzításra (amikor csak azt vesszük észre, ami alátámasztja a meglévő véleményünket) minden esetben elfogult választ adott. Ugyanígy a szerencsejátékosokat megkísértő „forró kéz” hiedelem (hot-hand fallacy – amikor mintákat keresünk a véletlenben) is még erősebben jelent meg a GPT-4-ben, mint a GPT-3.5-ben. Ugyanakkor bizonyos torzításokat képes volt elkerülni: például az alapeseti arányok figyelmen kívül hagyását (base-rate neglect), vagy a „süllyedő költség” tévedést (sunk cost fallacy – amikor a már elköltött pénz alapján hozunk rossz döntést).
A tanulmány szerint a ChatGPT emberi torzításai abból fakadnak, hogy a tanítása során azokat a mintázatokat sajátította el, amelyeket az emberek is követnek. A finomhangolás során ráadásul az emberek gyakran a hihetőbb, nem pedig a valóban logikus válaszokat díjazták, így az MI még inkább hajlamos az emberi sablonokra. Matematikailag egyértelmű feladatoknál jól teljesít, de minden, ami szubjektív vagy stratégiai döntést igényel, ott emberi felügyelet nélkül könnyen automatizálhatjuk a hibás gondolkodást.
Az MI-t úgy kellene kezelni, mint egy döntéshozó munkatársat: felügyelet, felelősség és etikai szabályok nélkül előbb szül hibákat, mint eredményeket.
🚗 A Ford már több mint 5 000 autószerelői állást kínál, miközben akár évi 43 millió forintot is kereshet az, aki elvállalja a munkát – mégsem jelentkezik elég ember...
⚠ 2025-ben az internet számtalan kihívással nézett szembe világszerte. A Cloudflare éves összefoglalója szerint több mint 180 jelentős leállás történt, amelyek minden kontinens szolgáltatásait érintették, rámutatva arra, mennyire sérülékeny maradt a globális hálózat – akár fejlett, akár fejlődő országról volt szó...
⚡ Elektrokémiai eszközök belsejében az erős elektromos terek olyan mértékben változtatják meg a vízmolekulák viselkedését, amely alapjaiban új megközelítést igényel...
🚀 Elon Musk cége, a SpaceX engedélyt kért egymillió műhold Föld körüli pályára állítására, hogy kiszolgálja a mesterséges intelligencia számításigényét...
Fontos kérdés, hogy bízhatnak-e továbbra is az európai vállalatok a tengerentúli, amerikai felhőszolgáltatókban – főként, amikor a digitális szuverenitás kérdése egyre hangsúlyosabbá válik...
🚶 Az Apple Watch egyre komolyabb szerepet játszik az egészségfigyelésben, hiszen az egyszerű fitneszfunkciókon túl már orvosilag is fontos adatokat kínál – például gyors értesítéseket a vérnyomásodat érintő hosszú távú változásokról...
A tokenizált részvények piaca látványos növekedést mutat, és most új lendületet kaphat azzal, hogy a New York-i Értéktőzsde (New York Stock Exchange, NYSE) és a Nasdaq is tervezi az éjjel-nappali, a hét minden napján zajló kereskedést...
🕵 Több mint 43 ezer évvel ezelőtt a neandervölgyiek évszázadokon át szarvas- és más agancsos állatok koponyáit gyűjtötték egy spanyolországi barlangban, amelyről most kiderült, hogy jóval összetettebb kulturális szokásokat tükröz, mint korábban gondolták...
🔍 Az Apple nemrég bemutatta az AirTag második generációját, fejlettebb hatótávval, hangosabb csengővel, nagyobb biztonsággal, de ugyanazzal a formával, mint korábban...
Az OnlyFans, a világszerte ismert felnőtt tartalomszolgáltató platform fontolgatja, hogy eladja a cég többségi tulajdonrészét az Architect Capital nevű befektetési cégnek...
A Sundance Filmfesztiválon bemutatott Szellem a gépben (Ghost in the Machine) dokumentumfilm kemény állítást fogalmaz meg: a mesterséges intelligencia terjedése és maga a Szilícium-völgy eugenikai (fajnemesítési) gyökerekből táplálkozik...
A legfrissebb jelentés szerint az Apple történetének eddigi legjobb negyedévét produkálta: a cég összbevétele csaknem 1437 milliárd forintot (143,76 milliárd USD) ért el...
Az amerikai űrügynökség, a NASA rendkívüli hangsúlyt fektet az űrhajósok biztonságára, miután a múlt hónapban egy négyfős legénységet kellett idő előtt visszahozni a Nemzetközi Űrállomásról egy ismeretlen eredetű egészségügyi probléma miatt...
😱 Az új év alig kezdődött el, máris két súlyos, kihasznált nulladik napi sérülékenységet kellett befoltoznia az Ivantinak az Endpoint Manager Mobile (EPMM) termékében...
💔 A hollywoodi közösség és rajongók világszerte megrendülten fogadták a hírt, hogy Catherine O’Hara, a komédia egyik legnagyobb alakja 71 évesen elhunyt Los Angeles-i otthonában egy rövid betegség következtében...
A részvénypiac lejtmenete után sok múlik a következő hét óriáscégein. Bár az S&P 500 három napig gyengült, ezek a visszafogott zárások még jót is tehetnek – főleg, ha az előttünk álló gyorsjelentési hullám nagy nevei jól teljesítenek...
A brit vasút történetében új korszak kezdődik: London nyugati részén elindul az első olyan vonat, amely kizárólag akkumulátorral üzemel, és rekordgyorsasággal, mindössze három és fél perc alatt feltölthető...