Az MI elszállt önbizalma néha már az emberi hülyeséget is túlszárnyalja
A ChatGPT-t fejlesztő OpenAI két nagy nyelvi modelljét, a GPT-3.5-öt és a GPT-4-et vizsgálták kanadai és ausztrál kutatók, hogy miként teljesítenek a legismertebb, emberi pszichológiából ismert döntési torzításokkal szemben. A friss tanulmány szerint az MI szinte pontosan úgy hajlik irracionális döntésekre, mint maga az ember: a megadott helyzetek közel felében bizonyult elfogultnak, sőt, időnként még erősebben is, mint mi. A jelenséget olyan torzítások esetén figyelték meg, mint a túlzott magabiztosság, a kockázatkerülés vagy a tulajdonosi hatás (endowment effect – amikor valamit csak azért tartunk értékesebbnek, mert már a miénk).
Az MI előszeretettel ismétli az emberi hibákat
A kutatók klasszikus pszichológiai kísérletek kérdéseit, illetve a való életből vett gazdasági példákat adtak fel a modellnek, például készletgazdálkodási vagy beszállítói tárgyalási helyzeteket. Míg a GPT-4 jobban teljesített a szigorúan matematikai, logikai feladatokban, addig a szubjektívebb, preferenciaalapú döntéseknél jól kimutathatók voltak az irracionális emberi mintázatok. Például a bizonyosságot még az embereknél is jobban kedvelte a gép, vagyis inkább választotta a biztosabb, kiszámíthatóbb megoldást, ha a feladat nem volt egyértelmű.
Néhány hibában még túl is tesz az MI
Kiderült, hogy a ChatGPT még felerősítheti a hibás gondolkodást: például a megerősítési torzításra (amikor csak azt vesszük észre, ami alátámasztja a meglévő véleményünket) minden esetben elfogult választ adott. Ugyanígy a szerencsejátékosokat megkísértő „forró kéz” hiedelem (hot-hand fallacy – amikor mintákat keresünk a véletlenben) is még erősebben jelent meg a GPT-4-ben, mint a GPT-3.5-ben. Ugyanakkor bizonyos torzításokat képes volt elkerülni: például az alapeseti arányok figyelmen kívül hagyását (base-rate neglect), vagy a „süllyedő költség” tévedést (sunk cost fallacy – amikor a már elköltött pénz alapján hozunk rossz döntést).
A tanulmány szerint a ChatGPT emberi torzításai abból fakadnak, hogy a tanítása során azokat a mintázatokat sajátította el, amelyeket az emberek is követnek. A finomhangolás során ráadásul az emberek gyakran a hihetőbb, nem pedig a valóban logikus válaszokat díjazták, így az MI még inkább hajlamos az emberi sablonokra. Matematikailag egyértelmű feladatoknál jól teljesít, de minden, ami szubjektív vagy stratégiai döntést igényel, ott emberi felügyelet nélkül könnyen automatizálhatjuk a hibás gondolkodást.
Az MI-t úgy kellene kezelni, mint egy döntéshozó munkatársat: felügyelet, felelősség és etikai szabályok nélkül előbb szül hibákat, mint eredményeket.
Az Anker új irányba lépett: a vállalat saját fejlesztésű, CIM (Compute-in-Memory) technológiát alkalmazó csipjével forradalmasíthatja a hordozható eszközök MI-teljesítményét...
Az Anthropic vadonatúj kiberbiztonsági modellje, a Claude Mythos Preview, a nagy techcégek belső tesztplatformjaiból indult hódító útjára alig pár hete...
Az amerikai védelmi minisztérium a következő pénzügyi évre 1,5 billió dolláros – közel 540 000 milliárd forintos – költségvetést kér, amelyben kulcsszerepet kap az eddigi legnagyobb drón- és drónellenes fejlesztési csomag...
A mobilgyártók egyre határozottabban távolodnak a kisméretű telefonoktól, ahogy például a Samsung után a kínai riválisok sem látják értelmét a 6 colos kijelzők fejlesztésének...
🏠 Az otthonhoz jutás problémája mára már nemcsak a huszon- és harmincéveseket sújtja: egyre több negyvenes, ötvenes, sőt idősebb vásárló is kiszorul a lakáspiacról...
Az Apple Watch véroxigénszint-mérője évek óta jogi viták középpontjában áll. Az okosóra 2020-ban debütált ezzel a forradalmi szenzorral, amely a véroxigénszintet méri...
Christian Weedbrook nevét néhány nap leforgása alatt ismerhette meg a világ: a Xanadu Quantum Technologies vezetőjeként hihetetlen gazdagságra tett szert, miután az MI jövőjét a kvantumszámítógépekhez kötötte...
📷 Új szintre lépett a mikroszkopikus világ villámgyors eseményeinek vizsgálata: kínai kutatók egy forradalmian új képrögzítési módszert mutattak be, amellyel hihetetlenül rövid, akár néhányszáz femtoszekundum alatt lezajló folyamatok minden eddiginél részletesebb megfigyelése vált lehetővé...
A Hubble űrtávcső idén már 36 éves, és most egy igazán friss, lélegzetelállító képpel ünnepli ezt: a Nyilas (Sagittarius) csillagképben található Trifid-köd legkülönlegesebb alakzata, az űrbéli citromcsiga (Cosmic Sea Lemon) újra lencsevégre került...
A YouTube mobilon mostantól automatikusan némítja azoknak a csatornáknak a push-értesítéseit, amelyeket több mint egy hónapja nem követsz figyelemmel...
🔥 Lényeges szempont, hogy a bitcoin hónapok óta nem látott tempóban erősödik: 14 egymást követő napon át pozitív a Coinbase-prémium, ami legutóbb tavaly októberben történt, amikor a kriptopénz történelmi csúcson, 126 000 dolláron (kb...
A Mozilla legfrissebb tesztjei során meglepő eredmények születtek: az Anthropic fejlesztette Mythos Preview MI-modellje 271 biztonsági sérülékenységet azonosított a hamarosan megjelenő Firefox 150 forráskódjában...
Felmerül a kérdés, hogy miként fordulhat elő, hogy egyetlen alkalmazotti tevékenység elegendő ahhoz, hogy egy egész vállalati infrastruktúrát feltörjék...
🟢 A Honor legújabb középkategóriás készüléke, a 600 Pro, már első ránézésre is ismerős lehet – a teljes szélességű, vízszintes kamerasziget, a precízen megmunkált unibody kialakítás és a hátlapi lencsék elrendezése határozottan idézi a prémium telefonok világát...
🎉 Hatalmas meglepetést okozott a Microsoft azzal, hogy lejjebb vitte a PC- és Xbox Game Pass havidíjait – ezt Ausztráliában már meg is érezhetik a játékosok...
🚧 Több mint 1300 Microsoft SharePoint-szerver maradt védtelen egy veszélyes biztonsági rés miatt, amelyet eredetileg nulladik napi támadás során használtak ki, és jelenleg is folyamatosan támadnak...
A Mozilla most először vetette be az Anthropic-féle Claude Mythos Preview-t, hogy átfésülje a Firefox forráskódját, és hirtelen 271 hibát sikerült feltárni a 150-es verziójában – eddig elképzelhetetlen tempóban...
🔎 A Google új szintre emelte kutató MI-ügynökeinek képességeit: a Deep Research és a Deep Research Max egyszerre képesek az internetet és a céges adatbázisokat is átfésülni, miközben átlátható, vizuális jelentéseket készítenek...
🔒 Az online vásárlások és digitális szolgáltatások világában a csalás elleni védelem és a felhasználói élmény folyamatosan ütközik: ha túl szigorú a biztonság, a valódi ügyfelek is elpártolnak; viszont ha túl engedékeny, akkor megsokszorozódnak a kártékony visszaélések...
Hárommillió, az OkCupid oldalról begyűjtött profilfotó törlésére kényszerült a Clarifai nevű MI-vállalat, miután az Egyesült Államok Szövetségi Kereskedelmi Bizottságával (FTC) egyezségre jutott egy hosszan húzódó adatvédelmi ügyben...
🕵 Erre utal többek között, hogy a közelgő Motorola Razr 2026 szinte minden műszaki részletét felfedte egy hatalmas szivárgás, jóval a hivatalos bejelentés előtt...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. BoobieTime Breastfeeding Timer (iPhone/iPad)A BoobieTime egy 2017-ben létrehozott digitális alkalmazás, melyet az alapítók első gyermekének születése ihletett...
☀️ Az elmúlt évben a globális energiafogyasztás alakulása drámai változást hozott: az elektromos áram iránti kereslet kétszer gyorsabban nőtt, mint az összes energiafogyasztás...