Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.
Versengés a megbízhatatlanságban
A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.
Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.
Etikai és forráskezelési problémák
A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.
Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.
Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.
A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.
Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”
Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.
Kezdetben mindennapjainkat és gazdasági döntéseinket digitális platformok uralták. Az online tevékenységek bővülésével egyre inkább ezekre a szolgáltatókra támaszkodtunk, legyen szó arról, hogy keresünk a Google-ben, üzenetet váltunk WhatsAppon, videókat nézünk a YouTube-on, kapcsolatot tartunk az Instagramon, vagy vásárolunk az Amazonon...
Képzeld el, hogy egy fontos céges kérdéssel fordulsz a vezérhez, várva a személyes, motiváló választ – aztán kiderül, hogy „Mark Zuckerberg” valójában csak egy mesterien kiképzett MI-klón, amely a vezér minden gesztusát, hangszínét, múltbeli nyilatkozatát, sőt a céges stratégiához fűzött gondolatait is tökéletesen utánozza...
🚀 Ezen a héten több tudományos szenzáció is született: az Artemis II űrmisszió hazatérése, a kihalás széléről visszatérő különleges új-zélandi madár, valamint a Torinói lepel erősen vitatott eredetű DNS-mintái mind hozzájárultak az izgalmakhoz...
Egy tízméteres hím púpos bálna hónapok óta vergődik a németországi Balti-tengeren, miközben egy egész ország látja tehetetlenül az állat lassú haldoklását...
🤓 Az egyetemi oktatás sosem volt könnyű pálya, hiszen a bér alacsony, a munka bizonytalan, mégis rengetegen választják, mert a tanítás öröme semmihez sem fogható...
🔒 A stablecoinok világában egyre nagyobb botrányt kelt, hogy hackerek százmilliókat lopnak el digitális valutákból, miközben a kibocsátók tétlenül nézik...
⚡ Az Adobe kritikus biztonsági frissítést adott ki az Acrobat és az Acrobat Reader szoftvereihez, hogy orvosolja a CVE-2026-34621 nevű sebezhetőséget, amelyet már hónapok óta zéró-napos támadásokban kihasználják...
Az Android Auto fejlesztései új lendületet kaptak: hamarosan lehetőség nyílik a klímaberendezés vezérlésére közvetlenül az autó kijelzőjéről, anélkül, hogy ki kellene lépni az Android Auto felületéről...
A növények növekedését a fény nemcsak serkenti, hanem korlátozhatja is. Japán kutatók meglepő eredményre jutottak: világosban fejlődő borsóhajtásokban az epidermisz – vagyis a növény külső rétege – sokkal szorosabban tapad az alatta lévő szövetekhez, mint a sötétben nevelt növények esetében...
💡 Egy lényeges szempont, hogy a Gigabyte GO27Q24G egy újabb próbálkozás arra, hogy a gamerek számára elérhető áron kínáljon OLED kijelzős monitort, mégpedig egy régebbi LG WOLED panel segítségével...
Külön említést érdemel, hogy az elmúlt napokban a Bitcoin továbbra is stabilan tartja magát 25,5 millió forint (70 000 USD) körül, még akkor is, ha világszerte erősödnek a geopolitikai feszültségek, és a hagyományos piacok inkább a biztonságot keresik...
🔒 Erre utal többek között az, hogy a csalók már hamis Windows-támogatói oldalakkal tévesztik meg a felhasználókat, ahol egy látszólagos, „összegző frissítés” (cumulative update) nevű Windows-frissítést kínálnak a 24H2-es verzióra...
Ha a mesterséges intelligencia gyorsabban váltja le az embereket a munkahelyeken, mint ahogy a gazdaság újra képes felszívni őket, az könnyedén kiütheti az alapokat a fogyasztói kereslet alól – ami nélkül a cégek is pórul járnak...
💉 Fontos kérdés, hogy van-e valódi előrelépés a hasnyálmirigyrák gyógyításában, amely a legalacsonyabb ötéves túlélési aránnyal rendelkező daganatos betegségnek számít, mindössze 13%-kal...
Érdemes megvizsgálni, mikor érdemes némítani az iPhone-t, hiszen rengeteg olyan helyzet adódik, amikor nem jön jól, ha pittyeg vagy rezeg a telefon: egy fontos megbeszélés, tanóra vagy éppen egy film alatt...
Az X, Elon Musk vezetésével, jelentősen csökkentette azoknak a felhasználóknak a kifizetéseit, akik kattintásvadász vagy másoktól átvett híreket osztanak meg...