Az MI elszállt önbizalma néha már az emberi hülyeséget is túlszárnyalja
A ChatGPT-t fejlesztő OpenAI két nagy nyelvi modelljét, a GPT-3.5-öt és a GPT-4-et vizsgálták kanadai és ausztrál kutatók, hogy miként teljesítenek a legismertebb, emberi pszichológiából ismert döntési torzításokkal szemben. A friss tanulmány szerint az MI szinte pontosan úgy hajlik irracionális döntésekre, mint maga az ember: a megadott helyzetek közel felében bizonyult elfogultnak, sőt, időnként még erősebben is, mint mi. A jelenséget olyan torzítások esetén figyelték meg, mint a túlzott magabiztosság, a kockázatkerülés vagy a tulajdonosi hatás (endowment effect – amikor valamit csak azért tartunk értékesebbnek, mert már a miénk).
Az MI előszeretettel ismétli az emberi hibákat
A kutatók klasszikus pszichológiai kísérletek kérdéseit, illetve a való életből vett gazdasági példákat adtak fel a modellnek, például készletgazdálkodási vagy beszállítói tárgyalási helyzeteket. Míg a GPT-4 jobban teljesített a szigorúan matematikai, logikai feladatokban, addig a szubjektívebb, preferenciaalapú döntéseknél jól kimutathatók voltak az irracionális emberi mintázatok. Például a bizonyosságot még az embereknél is jobban kedvelte a gép, vagyis inkább választotta a biztosabb, kiszámíthatóbb megoldást, ha a feladat nem volt egyértelmű.
Néhány hibában még túl is tesz az MI
Kiderült, hogy a ChatGPT még felerősítheti a hibás gondolkodást: például a megerősítési torzításra (amikor csak azt vesszük észre, ami alátámasztja a meglévő véleményünket) minden esetben elfogult választ adott. Ugyanígy a szerencsejátékosokat megkísértő „forró kéz” hiedelem (hot-hand fallacy – amikor mintákat keresünk a véletlenben) is még erősebben jelent meg a GPT-4-ben, mint a GPT-3.5-ben. Ugyanakkor bizonyos torzításokat képes volt elkerülni: például az alapeseti arányok figyelmen kívül hagyását (base-rate neglect), vagy a „süllyedő költség” tévedést (sunk cost fallacy – amikor a már elköltött pénz alapján hozunk rossz döntést).
A tanulmány szerint a ChatGPT emberi torzításai abból fakadnak, hogy a tanítása során azokat a mintázatokat sajátította el, amelyeket az emberek is követnek. A finomhangolás során ráadásul az emberek gyakran a hihetőbb, nem pedig a valóban logikus válaszokat díjazták, így az MI még inkább hajlamos az emberi sablonokra. Matematikailag egyértelmű feladatoknál jól teljesít, de minden, ami szubjektív vagy stratégiai döntést igényel, ott emberi felügyelet nélkül könnyen automatizálhatjuk a hibás gondolkodást.
Az MI-t úgy kellene kezelni, mint egy döntéshozó munkatársat: felügyelet, felelősség és etikai szabályok nélkül előbb szül hibákat, mint eredményeket.
A kriptopiac a május első hetében igazi izgalmakat tartogat. Három fontos próbatétel közeleg: az amerikai foglalkoztatási adatok publikálása, a legnagyobb tőzsdék és bányászvállalatok eredményjelentései, valamint döntő szavazások több decentralizált szervezetben...
Ez a jelenség jól illusztrálható azzal, milyen tempóban fejlődnek az otthoni hálózati adattárolók: míg néhány éve a terabájtos RAID-tömbök, a PCIe-bővítés vagy a villámgyors Thunderbolt csak vállalati környezetben volt elérhető, ma már egy átlagos otthoni NAS is ilyen extrákkal kecsegtet...
A cukorbetegség és elhízás kezelésére szolgáló gyógyszerek, mint az Ozempic és a Wegovy, nem várt pozitív hatásokat hordozhatnak a mentális egészségre is...
Túlgondolt hajápolási rutin helyett néhány szokás kis megváltoztatása látványosan egészségesebbé és fényesebbé varázsolja a hajad — ráadásul nincs szükség drága hajszárítóra vagy formázóra sem...
🔴 Egy átfogó nemzetközi vizsgálat kimutatta, hogy az Alzheimer-kór kezelésére fejlesztett szerek, amelyek az agyban felhalmozódó amiloid-béta fehérjét célozzák, nagy valószínűséggel nem hoznak valódi javulást a betegek életében...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. PostalCal (iPhone/iPad)A Postal Employee Day Off Calendar egy könnyen kezelhető, kifejezetten az Amerikai Postaszolgálat munkatársai és családjaik számára készült naptáralkalmazás...
Az Amnezia VPN legújabb, 4.8.15-ös verziója minden nagyobb operációs rendszeren elérhető, és egyszerre hoz jelentős hibajavításokat, kiemelten fontos biztonsági frissítést, valamint számos felhasználóbarát újítást...
💀 Matt Firor, a ZeniMax Online Studios alapítója elég markánsan emlékszik vissza arra a napra, amikor egy húzással két nagy stúdiót, a Tango Gameworksöt és az Arkane Austint is bezárták az Xboxnál...
A régi házakban vagy pincékben sokan titokzatos, megmagyarázhatatlan nyugtalanságot éreznek, akár anélkül, hogy bármi szokatlant látnának vagy hallanának...
Az 1990-es években a Marvel világa nyitott a videojáték-fejlesztés felé, de hőseinek és gonosztevőinek kezelése terén minden apró részletre odafigyelt...
A malária nemcsak megtizedelte őseinket, hanem döntően befolyásolta, hol élhettek, hogyan alakultak közösségeik és végső soron miként jutottunk el idáig...
Whitney Leavitt, aki A mormon feleségek titkos élete (Secret Lives of Mormon Wives) egyik főszereplője, váratlanul jelentette be távozását a népszerű Hulu-sorozatból – épp a Broadwayn futó, nagysikerű Chicago (Chicago) előadásán, vasárnap este...
💀 Olivia Wilde legutóbbi vörös szőnyeges megjelenésével nem kis riadalmat keltett: igencsak furcsán festett a San Francisco-i Nemzetközi Filmfesztiválon, ahol új filmjét, A meghívót (The Invite) népszerűsítette...
A Connections mai kihívása komoly fejtörést okozott a játékosoknak. Tizenhat szó közül kell megtalálni azokat a négyes csoportokat, amelyek valamilyen témában összetartoznak...
💰 A nagybankok – köztük a Morgan Stanley – egyre komolyabban foglalkoznak a digitális eszközök piacával, miután nő az ügyféloldali igény a Bitcoin iránt...
🎉 Nem hiszem el, de Jeremy Allen White nemcsak a Star Wars univerzumában repked, hanem most éppen a valóságban is rátolt egy nagy adrenalinbombát a gyerekeivel!..
💡 A Norton VPN for Agents a VPN-ek világában egy teljesen új irányt képvisel: kifejezetten MI-ügynökökre optimalizált, önállóan működő megoldásról van szó, amely feleslegessé teszi a klasszikus kliensalkalmazásokat és a bonyolult telepítési folyamatokat is...