Az MI elszállt önbizalma néha már az emberi hülyeséget is túlszárnyalja
A ChatGPT-t fejlesztő OpenAI két nagy nyelvi modelljét, a GPT-3.5-öt és a GPT-4-et vizsgálták kanadai és ausztrál kutatók, hogy miként teljesítenek a legismertebb, emberi pszichológiából ismert döntési torzításokkal szemben. A friss tanulmány szerint az MI szinte pontosan úgy hajlik irracionális döntésekre, mint maga az ember: a megadott helyzetek közel felében bizonyult elfogultnak, sőt, időnként még erősebben is, mint mi. A jelenséget olyan torzítások esetén figyelték meg, mint a túlzott magabiztosság, a kockázatkerülés vagy a tulajdonosi hatás (endowment effect – amikor valamit csak azért tartunk értékesebbnek, mert már a miénk).
Az MI előszeretettel ismétli az emberi hibákat
A kutatók klasszikus pszichológiai kísérletek kérdéseit, illetve a való életből vett gazdasági példákat adtak fel a modellnek, például készletgazdálkodási vagy beszállítói tárgyalási helyzeteket. Míg a GPT-4 jobban teljesített a szigorúan matematikai, logikai feladatokban, addig a szubjektívebb, preferenciaalapú döntéseknél jól kimutathatók voltak az irracionális emberi mintázatok. Például a bizonyosságot még az embereknél is jobban kedvelte a gép, vagyis inkább választotta a biztosabb, kiszámíthatóbb megoldást, ha a feladat nem volt egyértelmű.
Néhány hibában még túl is tesz az MI
Kiderült, hogy a ChatGPT még felerősítheti a hibás gondolkodást: például a megerősítési torzításra (amikor csak azt vesszük észre, ami alátámasztja a meglévő véleményünket) minden esetben elfogult választ adott. Ugyanígy a szerencsejátékosokat megkísértő „forró kéz” hiedelem (hot-hand fallacy – amikor mintákat keresünk a véletlenben) is még erősebben jelent meg a GPT-4-ben, mint a GPT-3.5-ben. Ugyanakkor bizonyos torzításokat képes volt elkerülni: például az alapeseti arányok figyelmen kívül hagyását (base-rate neglect), vagy a „süllyedő költség” tévedést (sunk cost fallacy – amikor a már elköltött pénz alapján hozunk rossz döntést).
A tanulmány szerint a ChatGPT emberi torzításai abból fakadnak, hogy a tanítása során azokat a mintázatokat sajátította el, amelyeket az emberek is követnek. A finomhangolás során ráadásul az emberek gyakran a hihetőbb, nem pedig a valóban logikus válaszokat díjazták, így az MI még inkább hajlamos az emberi sablonokra. Matematikailag egyértelmű feladatoknál jól teljesít, de minden, ami szubjektív vagy stratégiai döntést igényel, ott emberi felügyelet nélkül könnyen automatizálhatjuk a hibás gondolkodást.
Az MI-t úgy kellene kezelni, mint egy döntéshozó munkatársat: felügyelet, felelősség és etikai szabályok nélkül előbb szül hibákat, mint eredményeket.
Az irodai munka jövőjét alapjaiban forgathatja fel az OpenAI legújabb fejlesztése: a Workspace Agents lényegében lehetővé teszik, hogy vállalati környezetben saját MI-ügynököket hozzunk létre, akik nemcsak önállóan dolgoznak, de egyre több alkalmazással működnek együtt, például a Slackkel, a Salesforce-szal, a Google Drive-val vagy a Microsoft programjaival...
🏆 Több mint egy évtized után új fejezet nyílik a legendás stratégiassorozatban: a Hatalom és Mágia Hősei: Ősi kor (Heroes of Might and Magic: Olden Era) április 30-án érkezik korai hozzáféréssel PC-re...
Amikor 2023 áprilisában az FTX csődbiztosa 5%-os részesedést adott el a Cursor nevű MI-fejlesztő startupban 70 millió forintért, senki sem gondolta volna, hogy alig egy év múlva ez a csomag éppen 1 100 milliárd forintot érne...
🤓 Las Vegasban, egy exkluzív bemutatón a Google lerántotta a leplet a nyolcadik generációs Tensor Processing Unitokról (TPU-król), vagyis vadonatúj MI-chipekről...
⚡ A Cambridge-i Egyetem kutatói áttörést értek el egy olyan apró nanoelektronikai eszközzel, amelynek segítségével akár 70 százalékkal csökkenthető a MI-rendszerek energiafogyasztása...
🌎 Földünk felszíne alatt elképzelhetetlenül lassú áramlások dolgoznak a köpeny legmélyebb zónáiban, ahol az anyag mozgásai együtt járnak a tektonikus lemezek vándorlásával...
🏆 Tim Cook, az Apple leköszönő vezérigazgatója, a munkatársak előtt tartott megbeszélésen nyíltan beszélt karrierje legnagyobb kihívásairól és eredményeiről...
Az első kedvcsinálóval végre megérkezett Steven Spielberg A Felfedés Napja (Disclosure Day) című sci-fi filmjéhez az első igazi pillantás az idegenekre is...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Bugs help Baby: Learning Games (iPhone/iPad)A Bugs help Baby: Learning Games egy különösen felhasználóbarát alkalmazás, amely a 2–5 éves kisgyermekek korai fejlődését segíti...
Április 23-a évszázadok óta fordulópontok sora: a Clontarfi csata kimenetele, a Reinheitsgebot aláírása és a TBMM megalakulása éppúgy ide tartozik, mint a Soyuz 1 indítása és az első YouTube-videó feltöltése...
🍩 Egy 150 éves geometriai elvet cáfolt meg egy friss matematikai áttörés: sikerült két zárt, fánkszerű felületet létrehozni, amelyek helyi mérési adatai azonosak, de globálisan mégsem ugyanazok...
A Microsoft Universal Print felhasználói mostanában különösen sok bosszúságot tapasztalnak: sokan hiába próbálják megosztani a nyomtatókat, a rendszer hibát jelez, és nem hozza létre a nyomtatómegosztást...
A Mars felszíne alatt rejlő ősi szerves anyagok után szimatol a NASA Curiosity marsjárója, és most egész különleges, eddig nem látott szerves vegyületekre bukkant – köztük egy nitrogéntartalmú molekulára, amelynek szerkezete meglepően hasonlít a DNS előfutárához...
Kezdetben csak néhány cég vágott bele, most viszont nyolc jelentős bank és pénzügyi szolgáltató, köztük a Barclays, a Lloyds Banking Group, a Scottish Widows, az UBS és az Experian is részt vesz a brit pénzügyi felügyelet (FCA) MI-próbaprogramjában...