Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek

Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.

Versengés a megbízhatatlanságban

A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.

Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.

Etikai és forráskezelési problémák

A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.

Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.

Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.

Döntéskényszerben a kiadók

A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.

Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”

Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.

  • Te mit gondolsz arról, ha egyre több cég hagyatkozik generatív MI-alapú keresőkre a hagyományos keresők helyett?
  • Te mit tennél, ha a céged adatait illetéktelenül használná egy MI kereső, megsértve ezzel a robot.txt beállításaidat?


Legfrissebb posztok

hétfő 20:50

Az MI váratlan szövetséges az igazságosabb munkahelyekért

Bár az MI körül nagy a lelkesedés, sokan még mindig szkeptikusak maradnak két fő ok miatt: az automatizálás elveszi a munkát, vagy épp felerősíti az emberek előítéleteit...

hétfő 20:34

Az Amazon-alapító: Nem ciki, ha a munka az első

💼 Jeff Bezos nemcsak a világ leggazdagabb emberei közé tartozik, hanem amellett is kiáll, hogy a sikerhez nem elég fiatalon vállalkozást indítani – tudás és tapasztalat nélkül több a bukás, mint a jó ötlet...

hétfő 20:17

Az Endesa ügyfeleinek adatai a hackerek prédájává váltak

Spanyolország legnagyobb energiaszolgáltatója, az Endesa, valamint leányvállalata, az Energía XXI most jelentették be, hogy hackertámadás érte informatikai rendszereiket – az elkövetők személyes és szerződéses ügyféladatokhoz jutottak hozzá...

hétfő 20:01

Az indiai kormány újra drákói korlátozásokat tervez az okostelefonokra

📱 India szigorú, okostelefonokra vonatkozó biztonsági szabályokat tervez, amelyek köteleznék a gyártókat, hogy a sebezhetőségek elemzése érdekében hozzáférést biztosítsanak forráskódjukhoz a kormány számára...

hétfő 19:49

Az Apple átvette a trónt: a legnagyobb mobilgyártó a világon

2025 végére az Apple megelőzte a Samsungot, és a világ legnagyobb okostelefon-gyártójává vált az eladott készülékek száma alapján...

hétfő 19:33

Az Apple Sirije új agyat kap: jön a Google Gemini

💡 Az Apple és a Google hivatalosan bejelentették, hogy a következő Siri-verzió már a Gemini MI-t és a Google Cloudot fogja használni...

hétfő 19:18

Az új kristály átírja a mágnesességet: forradalom az adattárolásban?

📸 A Florida State University kutatói olyan kristályos anyagot alkottak, amely eddig nem látott, bonyolult mágneses viselkedést mutat...

hétfő 19:01

Az elfeledett gombatörténelem: a csiperkegomba születésének titka

🍄 A csiperkegomba (Agaricus bisporus) világviszonylatban az egyik legkedveltebb és legtöbbet termesztett ehető gombaféle, mégis mostanáig keveset tudtunk arról, hogyan vált ilyenné...

hétfő 18:49

A Roblox új szabálya megtiltja a gyerek–felnőtt csevegést

🔒 A Roblox az Egyesült Államokban új, kötelező biztonsági rendszert vezetett be, hogy megakadályozza a gyerekek és felnőttek közötti kommunikációt a platformján...

hétfő 18:33

Az Apple Siri mostantól a Google Gemini erejét használja

Az Apple és a Google többéves együttműködést kötött, amelynek részeként az Apple következő generációs MI-modelljei a Google Gemini technológiájára és felhőszolgáltatásaira fognak épülni...

hétfő 18:02

Az amerikai szankciók befagyasztották a 66 milliárd forintnyi USDT-t

🔒 Tether eddig példátlan összeget, több mint 182 millió dollárnyi (kb. 66 milliárd forint) USDT-t fagyasztott be öt Tron-blokkláncú tárcában, miután igazodott az amerikai pénzügyminisztérium szankciós előírásaihoz...

hétfő 17:50

Az Instagram jelszókáosza és a Veeam súlyos sebezhetőségei

🔒 Ez a jelenség jól illusztrálható azzal, hogy napjaink egyik legnépszerűbb közösségi oldalán, az Instagramon érzékeny felhasználói adatok tömege válhat veszélyeztetetté néhány programhiba miatt...

hétfő 17:33

Az egészségügy forradalmát hozza el Claude, berobban az MI

💉 Az Anthropic elhozta Claude-ot az egészségügybe, ezzel felveszi a versenyt az OpenAI ChatGPT-jével...

hétfő 17:20

Az arany újra tarol, a Bitcoin elbukik a menedék próbáján

Különösen igaz ez akkor, ha a gazdasági és politikai feszültségek elérik a csúcspontot: a hagyományos menedékeszközök, mint az arany vagy az államkötvények még mindig legyőzik a Bitcoint...

hétfő 17:02

Az akváriumok vége? Florida betiltaná a védett tengeri fajok befogását

Tavaly nyáron Floridát bejárta egy felháborodást keltő videó, amelyen férfiak Panama City partjainál egy óriás ördögráját fogtak be – egy szövetségi szinten veszélyeztetett fajt – majd a hajójukra emelték...

hétfő 16:49

Az MI-tanácsokkal életeket sodort veszélybe a Google

⚠️ A Google nemrég csendben eltávolította az MI Overviews nevű funkcióját bizonyos májvizsgálatokkal kapcsolatos kereséseknél, miután kiderült, hogy a rendszer veszélyes, félrevezető egészségügyi tanácsokat adott...

hétfő 16:34

A legendás Midas nyomában: az elveszett királysír Törökországban

🪙 Törökország évezredeken átívelő temetkezési halmai mindig tartogattak meglepetéseket, de a nyugat-anatóliai Karaa tumulusz most igazán felkavarta az állóvizet...

hétfő 16:17

Az új otthoni vércukormérők: megéri váltani?

Érdekes felvetés, hogy már nem kell minden vércukormérésért orvoshoz menni: ma egy megbízható, otthoni vércukormérővel akár naponta is nyomon követheted, hogyan reagál a szervezeted az ételekre és a mozgásra...

hétfő 16:02

Itt a gluténteszter: a gluténérzékenyek rég várt álma

A gluténérzékenyek számára valódi áttörést jelent a NIMA új generációs kézi gluténérzékelője, amely mostantól rendelhető az interneten...