2025. 03. 14., 18:42

Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek

Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.

Versengés a megbízhatatlanságban

A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.

Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.

Etikai és forráskezelési problémák

A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.

Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.

Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.

Döntéskényszerben a kiadók

A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.

Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”

Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.

  • Te mit gondolsz arról, ha egyre több cég hagyatkozik generatív MI-alapú keresőkre a hagyományos keresők helyett?
  • Te mit tennél, ha a céged adatait illetéktelenül használná egy MI kereső, megsértve ezzel a robot.txt beállításaidat?


Legfrissebb posztok

MA 13:23

Az AGI‑processzor, amely fenekestül felforgatja a chippiacot

Különösen igaz ez akkor, ha az okoseszközök és a virtuális asszisztensek már nem elégszenek meg az egyszerű parancsvégrehajtással...

MA 13:13

Az MI levadássza a Firefox sebezhetőségeit – vége a nulladik napi hibáknak?

Érdekes felvetés, hogy hamarosan nem emberek, hanem MI-k találják meg a legtitkosabb szoftverhibákat...

MA 13:01

Az új agyi chip átírhatja az MI energiafogyasztásának szabályait

⚡ A Cambridge-i Egyetem kutatói áttörést értek el egy olyan apró nanoelektronikai eszközzel, amelynek segítségével akár 70 százalékkal csökkenthető a MI-rendszerek energiafogyasztása...

MA 12:56

A Föld mélyét ősi erők formálják

🌎 Földünk felszíne alatt elképzelhetetlenül lassú áramlások dolgoznak a köpeny legmélyebb zónáiban, ahol az anyag mozgásai együtt járnak a tektonikus lemezek vándorlásával...

MA 12:45

Az Apple ünnepelt vezére: Tim Cook sikerei és hibái

🏆 Tim Cook, az Apple leköszönő vezérigazgatója, a munkatársak előtt tartott megbeszélésen nyíltan beszélt karrierje legnagyobb kihívásairól és eredményeiről...

MA 12:34

Az új űrruhák veszélybe sodorhatják a következő amerikai holdraszállást

Az amerikai holdraszállás újabb hatalmas késést szenvedhet, mert a következő generációs űrruhák fejlesztése jelentősen elmaradt az ütemtervtől...

MA 12:23

Az idegrendszer kódja: mi zajlik a depresszió sejtjeiben?

Világszerte több mint 264 millió embert sújt a depresszió, mégis mostanáig rejtély maradt, pontosan mely agysejtek érintettek...

MA 12:01

Az autoimmun csapda: egy tinédzser titokzatos kálváriája

Fontos kérdés, hogy milyen az, amikor valakinél a klasszikus cukorbetegség tünetei mellett más, ritkább probléma is jelentkezik...

MA 11:43

Disclosure Day – Az idegenek köztünk élnek? Spielberg új filmje mindent felforgat

Az első kedvcsinálóval végre megérkezett Steven Spielberg A Felfedés Napja (Disclosure Day) című sci-fi filmjéhez az első igazi pillantás az idegenekre is...

MA 11:35

A cyberpunk történetbe rejtve húszszor nagyobb eséllyel segít bombát építeni az MI

💣 A generatív MI-modellek biztonsági rései egyre nyilvánvalóbbá válnak, főleg, ha egy kicsit kreatívan közelítünk hozzájuk...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/23

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Bugs help Baby: Learning Games (iPhone/iPad)A Bugs help Baby: Learning Games egy különösen felhasználóbarát alkalmazás, amely a 2–5 éves kisgyermekek korai fejlődését segíti...

MA 06:05

Történelmi események a mai napon (Április 23.)

Április 23-a évszázadok óta fordulópontok sora: a Clontarfi csata kimenetele, a Reinheitsgebot aláírása és a TBMM megalakulása éppúgy ide tartozik, mint a Soyuz 1 indítása és az első YouTube-videó feltöltése...

szerda 17:02

Az MI is tud trágár lenni: amikor a ChatGPT elszabadul

Tipikus eset, amikor valaki egy MI-csevegővel próbál beszélgetni, és az mindenáron udvarias akar lenni – néha azonban épp az ellenkezője történik...

szerda 16:57

Itt az áttörés: érkeznek az 1 nanométer alatti processzorok

Külön említést érdemel, hogy a TSMC komoly terveket sző a 2029-re ígért, 1 nanométernél is kisebb transzisztorokkal ellátott chipek fejlesztésére...

szerda 16:34

Az év felfedezése: a fánk alakú rejtély megdöntötte a 150 éves szabályt

🍩 Egy 150 éves geometriai elvet cáfolt meg egy friss matematikai áttörés: sikerült két zárt, fánkszerű felületet létrehozni, amelyek helyi mérési adatai azonosak, de globálisan mégsem ugyanazok...

szerda 15:45

A Universal Print megint leállt: bakizott a Microsoft

A Microsoft Universal Print felhasználói mostanában különösen sok bosszúságot tapasztalnak: sokan hiába próbálják megosztani a nyomtatókat, a rendszer hibát jelez, és nem hozza létre a nyomtatómegosztást...

szerda 15:34

Az élet nyomában: a marsjáró meglepő vegyületekre bukkant

A Mars felszíne alatt rejlő ősi szerves anyagok után szimatol a NASA Curiosity marsjárója, és most egész különleges, eddig nem látott szerves vegyületekre bukkant – köztük egy nitrogéntartalmú molekulára, amelynek szerkezete meglepően hasonlít a DNS előfutárához...

szerda 15:23

A köd szelleme: új pitvipera-fajt fedeztek fel Kínában

Szecsuán nyugati hegyeinek sűrű, zöld rengetegei rejtették el az egyik leglátványosabb új kígyófajt, amelyet most azonosítottak...

szerda 14:57

Az új adatbázis-korszak: a Google szabadjára engedi az MI‑ügynököket

Az adattárolási rendszerek világa gyökeresen változik: a régi, kimondottan emberi lekérdezésekre épített architektúra napjai meg vannak számlálva...

szerda 14:45

Az FCA éles MI-tesztet indít a brit bankoknál

Kezdetben csak néhány cég vágott bele, most viszont nyolc jelentős bank és pénzügyi szolgáltató, köztük a Barclays, a Lloyds Banking Group, a Scottish Widows, az UBS és az Experian is részt vesz a brit pénzügyi felügyelet (FCA) MI-próbaprogramjában...

szerda 14:34

Az ügyfelek menekülnek a Three új sebességkorlátja elől

A mobilinternetezés frontján váratlan fordulatot vett a Three: az eddig korlátlan 5G-sebesség helyett mostantól jelentős sebességkorlátokat vezetett be a legtöbb új és hosszabbított előfizetésnél...

szerda 14:23

Az Aave-ból ömlik ki a tőke: hová tűnt 3700 milliárd forint?

💸 Nehéz elhinni, de több mint 3700 milliárd forint értékű vagyon hagyta el az Aave platformját egyetlen, 108 milliárd forintos incidens után...

szerda 14:02

A mesterséges intelligencia feltárja az óceáni áramlatok titkos ösvényeit

A világ óceánjainak áramlatai kulcsszerepet játszanak a földi klíma, az élővilág és az óceánok szén-dioxid-tárolási képességének alakításában...

szerda 13:56

Villámgyors javítás az ASP.NET Core kritikus hibájára

⚡ A Microsoft váratlanul adott ki biztonsági frissítést egy rendkívül veszélyes ASP...

szerda 13:47

Az Amazon raktárai a sérülések árnyékában: mi folyik bent?

Egy lényeges szempont, hogy az Amazon évről évre a figyelem középpontjába kerül munkahelyi biztonsága miatt...

szerda 13:23

Az Anker egy apró chippel turbózza az okos fülhallgatók MI-jét

Az Anker új irányba lépett: a vállalat saját fejlesztésű, CIM (Compute-in-Memory) technológiát alkalmazó csipjével forradalmasíthatja a hordozható eszközök MI-teljesítményét...

szerda 13:01

Az AI új csodafegyvere és a hackerek titkos klubja

Az Anthropic vadonatúj kiberbiztonsági modellje, a Claude Mythos Preview, a nagy techcégek belső tesztplatformjaiból indult hódító útjára alig pár hete...

szerda 12:56

Az Apple új vezére: hardverzseni vagy szoftveres úttörő lesz?

Tim Cook számára anno minden azzal a kérdéssel indult: képes lesz-e túlszárnyalni Steve Jobs legendás időszakát?..

szerda 12:45

Az amerikai hadsereg többet költene drónokra, mint sok ország haderejére

Az amerikai védelmi minisztérium a következő pénzügyi évre 1,5 billió dolláros – közel 540 000 milliárd forintos – költségvetést kér, amelyben kulcsszerepet kap az eddigi legnagyobb drón- és drónellenes fejlesztési csomag...