Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek

Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.

Versengés a megbízhatatlanságban

A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.

Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.

Etikai és forráskezelési problémák

A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.

Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.

Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.

Döntéskényszerben a kiadók

A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.

Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”

Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.

  • Te mit gondolsz arról, ha egyre több cég hagyatkozik generatív MI-alapú keresőkre a hagyományos keresők helyett?
  • Te mit tennél, ha a céged adatait illetéktelenül használná egy MI kereső, megsértve ezzel a robot.txt beállításaidat?


Legfrissebb posztok

szombat 18:40

Leghaszontalanabb amerikai szlengek és idiómák

“Wallet biopsy” Szó szerint: pénztárca-biopszia 💸, amikor egy orvos vagy egészségügyi szolgáltató előbb ellenőrzi 🔬, mennyi pénzed / biztosításod van, és aztán dönti el, milyen vizsgálatot kapsz...

csütörtök 18:24

Penrose szám: A bizonyíték Isten létére?

Sir Roger Penrose brit matematikus és elméleti fizikus, aki a fekete lyukak szingularitásának és az általános relativitáselmélet új matematikai alapjainak feltárásáért kapott Nobel-díjat, az 1970-es években sokkoló, a tudományos világot megosztó tézist közölt...

MA 14:02

A kiberbiztonság titka: a nyitott gondolkodás forradalma

🔒 A modern kiberbiztonságban nemcsak új eszközök és technológiák, hanem gondolkodásmódváltás is elengedhetetlen...

MA 13:18

A Kill Bill elveszett fejezete végre elkészült – Tarantinótól, Fortnite-ban

Fontos kérdés, hogyan kerülhetett Quentin Tarantino legendás bosszúeposza, az Öld meg Billt (Kill Bill) egy új fejezete éppen a Fortnite digitális világába...

MA 13:01

A valódi titkok nem a Stranger Things színdarabban bújnak meg

🔑 Az „A furcsa dolgok: Az első árnyék” (Stranger Things: The First Shadow) című színdarab tavaly decemberi londoni premierje óta sok rajongó tartott attól, hogy fontos részletek csak New Yorkban, ezer dollár feletti (kb...

MA 12:34

A hullámzó kínai gyártás: fordulat jön, vagy újabb zuhanás?

📈 A kínai gyáripar némileg javult novemberben, de továbbra is zsugorodik, immár nyolcadik hónapja...

MA 11:49

Az Asahinál példátlan adatlopásra derült fény

🔒 Egy szeptemberi kibertámadás miatt az Asahi Group Holdings, Japán legnagyobb sörgyártója, közel 1,9 millió ember adatait veszítette el...

MA 11:33

A szoftverhiba földre parancsolta az Airbus gépeit

Több mint 6000 Airbus A320-as gép földre kényszerült világszerte, miután a gyártó felismerte, hogy az intenzív naptevékenység miatt szoftverhiba fenyegeti a repülésbiztonságot...

MA 11:18

Az információ fényen utazik: közel a kvantuminternet kora

Jellemző példa erre, hogy a kvantumteleportáció területén sikerült olyan áttörést elérni, amely az információ fény segítségével történő átvitelét teszi lehetővé – ráadásul teljesen különálló kvantumpontok között...

MA 10:53

Az öt legjobb belépő szintű fényképezőgép vadfotózóknak 2025-ben

📷 A természetfotózás varázsa nehezen utolérhető – vadállatot, madarat vagy akár egy villámgyors mozdulatot elkapni mindig különleges élmény...

MA 10:37

Az ősi dinoszaurusz-múmia átírja a tankönyveket: paták és taréj

Megvizsgálandó, hogy milyen új titkokat rejtenek a dinoszaurusz-múmiák, egy amerikai kutatócsoport most minden eddiginél részletesebb, teljes testű rekonstrukciót alkotott az Edmontosaurus annectensről...

MA 10:29

A ChatGPT új kedvenc funkciója nem az, amire számítasz

💡 Hároméves lett a ChatGPT, és ennek örömére az OpenAI végre elárulta, melyek a legnépszerűbb funkciók a világ kedvenc MI-eszközében...

MA 10:22

Az RSV megelőzése átírhatja az asztma jövőjét

Új kutatások szerint ha sikerül megóvni az újszülötteket a légúti syncytialis vírus (RSV)-fertőzéstől, azzal drasztikusan csökkenthető a későbbi asztma kialakulásának kockázata...

MA 10:02

Az új Deadpool VR: még egy Marvel-agyrágó?

😎 Felmerül a kérdés, hogy lehet-e még újat mutatni a Marvel-univerzum fáradtnak tűnő világában egy VR-játékkal, amelyben Deadpool kapja a főszerepet...

MA 09:57

A Pikipek-láz visszatér: mindent a Pokémon GO Community Day-ről

🐢 November 30-án, vasárnap 14 és 17 óra között jön a Pikipek Community Day a Pokémon GO-ban, amikor szó szerint ellepnek minket a Pikipekek – és a szerencsésebbek fényes (shiny) változatot is kifoghatnak...

MA 09:21

Az olasz MI-pajzs: láthatatlan kupola óvja a városokat

Az olasz Leonardo védelmi vállalat bemutatta legújabb fejlesztését, egy MI-vezérelt védelmi kupolát, amely a városok és kulcsfontosságú infrastruktúrák védelmét szolgálja...

MA 09:15

A 401(k) nélkül is van élet: így gyűjts okosan nyugdíjra

💰 A nyugdíjcélú megtakarítások elengedhetetlenek, ha gondtalan időskort szeretnél. A legtöbben automatikusan 401(k)-t használnak, ha a munkahelyükön elérhető, hiszen ez bérlevonással gyűlik, így észrevétlenül nő a megtakarítás, ráadásul sok cég extra hozzájárulást is ad...

MA 09:08

A Batman-hatás: ahol megjelenik, megnyílnak a pénztárcák

Olasz kutatók meglepő eredményre jutottak: ha valaki Batman-jelmezben bukkan fel egy milánói metrókocsiban, az utasok kétszer olyan gyakran adják át a helyüket egy várandós nőnek, mint amikor Batman nincs jelen...

MA 09:01

A Playdate-en végre játékos hangüzeneteket küldhetsz

Megjelent egy aranyos hangüzenet-küldő alkalmazás a Playdate kézikonzolra, amely kifejezetten akkor jön jól, ha a baráti vagy a családi körödben többen is rendelkeznek ezzel a kütyüvel...