Az MI még mindig naiv: nem tud különbséget tenni tény és vélemény között

Az MI még mindig naiv: nem tud különbséget tenni tény és vélemény között
A legújabb kutatások szerint a mai nagyméretű nyelvi modellek, mint a GPT-4o, még mindig komoly gondban vannak azzal, hogy megkülönböztessék a tényeket az emberi hiedelmektől – főleg, ha a hiedelem hamis. Ez jelentősen növeli a téves információk terjedésének kockázatát.

Hibás döntések a fontos területeken

A Stanford Egyetem kutatói 24 népszerű MI-modellt teszteltek, több mint 13 ezer kérdésre adott válaszaikat vizsgálva. Kiderült, hogy az újabb modellek – például a 2024 májusában megjelent GPT-4o – 34 százalékkal kevésbé ismerték fel a hamis hiedelmeket, mint a valósakat. A régebbi modelleknél ez az arány még rosszabb volt: ott 39 százalékos különbséget találtak. A modellek a tények felismerésében is eltérően teljesítettek: az újabbaknál 91 százalékos pontosságot mértek, a régebbieknél csak 72–85 százalék közöttit.

Felületes gondolkodásmód és veszélyes hiányosságok

A vizsgált modellek nem valódi tudásra vagy logikus helyzetfelismerésre támaszkodnak, inkább mintázatokat ismernek fel – ez könnyen félrevezetheti az embereket. Különösen olyan területeken, ahol a pontatlan MI-válasz emberi életeket, illetve jogi vagy tudományos eredményeket befolyásolhat.

Az MI mindenhol ott lesz, akkor is, ha hibázik

Idén világszerte közel 555 billió forintot (1,5 billió dollárt) költenek MI-fejlesztésre – jósolja a Gartner elemzőcég. Az MI nemcsak a telefonokban vagy autókban, hanem a kenyérpirítókban és a streaming-szolgáltatásokban is megjelenik. Az elterjedést egyelőre nem akadályozzák a hibák, pedig például az MI-alapú ügyfélszolgálatok erősen alulteljesítenek, és a titoktartás jelentőségét sem értik.

2025, adrienne, go.theregister.com alapján

Legfrissebb posztok

csütörtök 12:25

A 6 legbénább szexuális célzás a marketing történelemben

A szex használata a reklámban egyidős annak létrejöttével. Ezer százalék, hogy az első reklámban ami az első kereket reklámozta, rögtön kettőt raktak egymás mellé, hogy egy pár cickóra hasonlítson...

kedd 14:10

Egy könyvvel az ellenség szívéhez – Franklin megdöbbentő módszere

Egy nap eszébe jutott valami merész és szokatlan. Tudta, hogy ellenfelének könyvtárában számos ritka és értékes kötet található, melyekre nagy becsben tartott, és az is köztudott volt, hogy igazi büszkesége egyik különleges könyv volt, amelyet csak kevesen olvashattak...

MA 20:52

Az utolsó neandervölgyi: A kihalás titka a génhígulásban?

Több évtizedes találgatás övezi, miért tűntek el a neandervölgyiek nagyjából 40 ezer éve...

MA 20:42

Az MI ereje is kevés volt, egy CPU-csúcs buktatta le a zsarolóvírust

💣 Egy heves CPU-kiugrás csak ritkán jelent jót – de egy vállalati szerver kapacitásának hirtelen túlterhelődése most egy egész céget mentett meg a katasztrófától...

MA 20:32

Az új üstökös titokzatos pályán közelít a Földhöz

Egy frissen felfedezett üstökös, a C/2025 V1 (Borisov), amelyet néhányan tévesen a hírhedt 3I/ATLAS-szal hoznak összefüggésbe, várhatóan november 11-én halad el legközelebb bolygónk mellett...

MA 20:21

Az űripar új kedvence: Rocket Lab szárnyal rekordbevételekkel

🚀 A Rocket Lab részvénye 3%-kal erősödött, miután a vállalat története eddigi legjobb negyedéves bevételét jelentette...

MA 20:11

CoreWeave: Az MI-aranyláz sötét oldala – brutális profit és óriási adósság

A CoreWeave az idei harmadik negyedévben 134%-os bevételnövekedést ért el, 490 milliárd forintnak (1,36 milliárd USD) megfelelő bevétellel, jócskán túlszárnyalva az elemzői várakozásokat...

MA 20:00

Az MI-vel felturbózott Bixby mostantól a Samsung tévéken is elérhető

A Samsung legújabb fejlesztése, a generatív MI-alapú Bixby asszisztens, már a tévéken is bemutatkozott...

MA 19:53

A legfurcsább ügyvédi kifogások, amikor az MI kudarcot vall

🙃 Az amerikai bíróságokat egyre gyakrabban árasztják el a hamis, MI által generált jogesetekre való hivatkozások, amit egyes bírók már járványnak tartanak...

MA 19:41

Az SAP súlyos biztonsági hibákat javított, most érdemes frissíteni

Az SAP kiadta novemberi biztonsági frissítéseit, amelyek több súlyos sérülékenységet orvosolnak...

MA 19:32

Az óriási szélturbina minden eddiginél nagyobb teljesítményt nyújt

A kínai partoknál hamarosan telepítik a világ legnagyobb tengeri szélturbináját, amely két rotorral és gigantikus lapátokkal szinte megduplázza az eddigi rekordokat...

MA 19:21

Az új Wyze mérleg minden porcikádat kielemzi

A Wyze bemutatta eddigi legpontosabb, egyben legdrágább okosmérlegét, az Ultra BodyScant...

MA 19:12

Az első mikrohullámú számítógépes chip forradalmasíthat mindent

⚡ Egy új típusú mikrochip született, amely hagyományos digitális áramkörök helyett mikrohullámokat használ, és így villámgyors működésre, valamint alacsony energiafogyasztásra képes...

MA 19:02

A Meta MI-zsenije saját céget alapít – káosz a háttérben

Az MI világában igazi földindulást okozhat, hogy Yann LeCun, a Meta vezető MI-kutatója és a New York-i Egyetem professzora a közeljövőben távozik, hogy saját startupot indítson...

MA 18:51

Az új Gemini for Home végre okos otthonokat ígér

Két hete elindult a Google Gemini for Home hangasszisztens, és a felhasználók első tapasztalatai alapján tényleg átalakítja az okosotthonokkal való kommunikációt...

MA 18:42

A Neutron rakéta bemutatóját 2026 nyarára halasztották

A Rocket Lab közepes teherbírású rakétája, a Neutron várhatóan csak 2026 nyarán állhat először rajthoz, miután a cég vezérigazgatója, Peter Beck bejelentette: a fejlesztést szándékosan nem siettetik, elsődleges a megbízhatóság...

MA 18:34

A Samsung Q8F QLED modern tévé, de drága kompromisszumokat jelent

A Samsung Q8F QLED TV a dél-koreai gyártó legújabb középkategóriás zászlóshajója, amely látványos, karcsú dizájnnal és a felhasználóbarát Tizen 9...

MA 18:22

Az MI-csevegéseket oldalsó támadás fenyegeti

🕵 A Microsoft kutatói új, aggasztó sérülékenységre hívták fel a figyelmet: egy új típusú oldalsó csatornás támadás lehetővé teszi a támadók számára, hogy megtippeljék, miről beszélgetünk a nagy nyelvi modellekkel (MI-kkel), még akkor is, ha maga a tartalom titkosítva van...

MA 17:01

Az új kínai csúcs: szinte megállt a CO2-kibocsátás

Kínában az elmúlt másfél évben stagnált vagy csökkent a szén-dioxid-kibocsátás, ami erősíti a reményt, hogy a világ legnagyobb szennyezője a vártnál jóval korábban elérte kibocsátási csúcsát...