Az MI elszállt önbizalma néha már az emberi hülyeséget is túlszárnyalja
A ChatGPT-t fejlesztő OpenAI két nagy nyelvi modelljét, a GPT-3.5-öt és a GPT-4-et vizsgálták kanadai és ausztrál kutatók, hogy miként teljesítenek a legismertebb, emberi pszichológiából ismert döntési torzításokkal szemben. A friss tanulmány szerint az MI szinte pontosan úgy hajlik irracionális döntésekre, mint maga az ember: a megadott helyzetek közel felében bizonyult elfogultnak, sőt, időnként még erősebben is, mint mi. A jelenséget olyan torzítások esetén figyelték meg, mint a túlzott magabiztosság, a kockázatkerülés vagy a tulajdonosi hatás (endowment effect – amikor valamit csak azért tartunk értékesebbnek, mert már a miénk).
Az MI előszeretettel ismétli az emberi hibákat
A kutatók klasszikus pszichológiai kísérletek kérdéseit, illetve a való életből vett gazdasági példákat adtak fel a modellnek, például készletgazdálkodási vagy beszállítói tárgyalási helyzeteket. Míg a GPT-4 jobban teljesített a szigorúan matematikai, logikai feladatokban, addig a szubjektívebb, preferenciaalapú döntéseknél jól kimutathatók voltak az irracionális emberi mintázatok. Például a bizonyosságot még az embereknél is jobban kedvelte a gép, vagyis inkább választotta a biztosabb, kiszámíthatóbb megoldást, ha a feladat nem volt egyértelmű.
Néhány hibában még túl is tesz az MI
Kiderült, hogy a ChatGPT még felerősítheti a hibás gondolkodást: például a megerősítési torzításra (amikor csak azt vesszük észre, ami alátámasztja a meglévő véleményünket) minden esetben elfogult választ adott. Ugyanígy a szerencsejátékosokat megkísértő „forró kéz” hiedelem (hot-hand fallacy – amikor mintákat keresünk a véletlenben) is még erősebben jelent meg a GPT-4-ben, mint a GPT-3.5-ben. Ugyanakkor bizonyos torzításokat képes volt elkerülni: például az alapeseti arányok figyelmen kívül hagyását (base-rate neglect), vagy a „süllyedő költség” tévedést (sunk cost fallacy – amikor a már elköltött pénz alapján hozunk rossz döntést).
A tanulmány szerint a ChatGPT emberi torzításai abból fakadnak, hogy a tanítása során azokat a mintázatokat sajátította el, amelyeket az emberek is követnek. A finomhangolás során ráadásul az emberek gyakran a hihetőbb, nem pedig a valóban logikus válaszokat díjazták, így az MI még inkább hajlamos az emberi sablonokra. Matematikailag egyértelmű feladatoknál jól teljesít, de minden, ami szubjektív vagy stratégiai döntést igényel, ott emberi felügyelet nélkül könnyen automatizálhatjuk a hibás gondolkodást.
Az MI-t úgy kellene kezelni, mint egy döntéshozó munkatársat: felügyelet, felelősség és etikai szabályok nélkül előbb szül hibákat, mint eredményeket.
🤓 Kevesebben tartoznak Genghis Khan híres vérvonalához, mint korábban gondolták. Egy friss genetikai kutatás új fényt vet legendás ősünk családfájára, megingatva a világszerte elterjedt mítoszt arról, hogy minden 200...
✈ A Spirit Airlines ismét túlélési harcot folytat. Az Egyesült Államok egyik legismertebb fapados légitársasága bejelentette, hogy lényegesen kisebb méretben folytatja működését, miközben próbál kimászni második csődeljárásából alig két éven belül...
A volumetrikus 3D-nyomtatásban komoly áttörést értek el a Tsinghua Egyetem kutatói: úgy sikerült felgyorsítaniuk a folyamatot, hogy a szokásos forgó gyantakád helyett egy nagysebességű periszkópot használtak...
🚀 A világ legfiatalabb és legnagyobb becsapódási kráterét fedezhették fel Kína sűrű erdeiben, mégpedig az ország északkeleti részén, Heilongjiang tartományban, a Lesser Xing’an hegységben...
A Wynn Resorts hivatalosan is elismerte, hogy hackertámadás érte vállalati rendszerét, amelynek során illetéktelenek dolgozói adatokat szereztek meg...
Lindsey Vonn, az amerikai síelés ikonikus alakja pályafutása során többször bizonyította elképesztő kitartását, de az idei téli olimpia előtt történt sérülése még számára is életveszélyes kalanddá vált...
💡 Egy spanyol startup, a Multiverse Computing egy jelentősen tömörített, nagy nyelvi modelljével hívja fel magára a figyelmet, amely jóval kisebb méretű, mint versenytársai, mégis hasonló pontosságot ér el...
Ez a jelenség jól illusztrálja, hogy a brit Wayve MI-startup most 1,2 milliárd dollárt, azaz közel 433 milliárd forintot vont be befektetőktől, köztük olyan technológiai óriásoktól, mint az Nvidia és az Uber, valamint három autóipari világmárkától...
A Saarland Egyetem vegyészei végre elérték azt, amire fél évszázada várt a tudományos világ: sikerült szintetizálniuk egy régóta keresett szilíciumalapú aromás molekulát...
Alaszka középső részén, a Tanana-völgyben meglepően régi, 14 ezer éves eszközök kerültek elő, amelyek új fényt vetnek arra, hogyan jutottak el az első emberi közösségek Amerikába...
Lényeges szempont, hogy a fuvarozói és logisztikai cégek mostanában nemcsak a kamionjaikra, hanem a digitális rendszereikre is nagy veszélyek leselkednek...
🛡 A világ legnépszerűbb fogyasztói dróngyártója, a kínai DJI pert indított az Amerikai Szövetségi Hírközlési Bizottság (FCC) ellen az Egyesült Államokban érvényben lévő importtilalom miatt...
⚡ A James Webb űrtávcső lenyűgöző részletességgel térképezte fel az Uránusz rejtélyes felső légkörét, és olyan, eddig ismeretlen jelenségeket fedezett fel, amelyek új fényt vetnek a bolygó furcsa mágneses terére, illetve a légkörében tomboló sarki fényekre...
💡 Az Alzheimer-kór kialakulására mindig is az agyi plakkok és a memóriavesztés szolgált magyarázatul, de most friss kutatások új tényezőre hívják fel a figyelmet...
🤖 Nem hiszem el, de idén tényleg érdemes korábban nekiállni az adóbevallásnak – főleg, mert a 2025-ös gigatörvény (OBBBA) miatt mindenki meglepetésekre számíthat...
Külön említést érdemel, hogy a Discord jelentős változást jelentett be: elhalasztják a felhasználók életkor-ellenőrzésére vonatkozó intézkedések bevezetését...
El sem hisszük, de tényleg: a Rozsomák (Marvel’s Wolverine) megjelenési dátuma felkerült a PlayStation csatornájára, és már szeptember 15-én érkezik!..
🔒 Felmerül a kérdés, hogy az online biztonság érdekében meddig mehetnek el a techóriások, és az Apple ismét lépett: új korhatár-ellenőrző eszközöket vezet be világszerte, hogy megfeleljen a gyermekvédelmi jogszabályok egyre szövevényesebb hálójának...
Jellemző példa erre, hogy két, ugyanott meghirdetett, ugyanolyan állás sincs azonos árazással – az egyik cégnél a fizetés 7 millió forinttól 36 millió forintig terjed, egy másiknál viszont szűk sávban, 35 és 39 millió forint között van...
Anchorage Digital, az Egyesült Államok első szövetségi kriptobankja, a saját mérlegére vette a Strategy nevű, bitcoin-kincstárral rendelkező cég örökjáradék jellegű elsőbbségi részvényeit...