Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek

Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.

Versengés a megbízhatatlanságban

A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.

Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.

Etikai és forráskezelési problémák

A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.

Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.

Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.

Döntéskényszerben a kiadók

A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.

Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”

Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.

  • Te mit gondolsz arról, ha egyre több cég hagyatkozik generatív MI-alapú keresőkre a hagyományos keresők helyett?
  • Te mit tennél, ha a céged adatait illetéktelenül használná egy MI kereső, megsértve ezzel a robot.txt beállításaidat?


Legfrissebb posztok

csütörtök 20:49

A világegyetem első küllős spirálgalaxisára bukkantak

💫 Eddig ismeretlen, több mint 11,5 milliárd éve létező küllős spirálgalaxist fedeztek fel, amely már alig 2 milliárd évvel az ősrobbanás (Big Bang) után kialakult...

csütörtök 20:33

A Rubin Obszervatórium felfedezte a valaha mért leggyorsabb óriásaszteroidát

🚀 A Vera C. Rubin Obszervatórium mindössze hét éjszaka alatt végzett megfigyelései során lenyűgöző felfedezés született: sikerült azonosítani egy hatalmas, rekorddöntő aszteroidát, amely elképesztő sebességgel forog...

csütörtök 20:18

Az űrszemét-bomba ketyeg: három nap múlva jön a káosz?

💥 A műholdak rohamosan közelednek egymáshoz a Föld körül, és sosem voltunk még ilyen közel egy katasztrofális ütközési láncreakcióhoz...

csütörtök 20:02

Az Android 17-tel végre elrejtheted a privát értesítéseket

🔒 Az Android 17 várhatóan komoly lépést tesz a magánszféra védelmében: végre natív alkalmazászár funkcióval érkezhet...

csütörtök 19:33

A BlackBerry visszatér: teszten a Clicks Communicator

Lényeges szempont, hogy a régi BlackBerry-rajongók újra örülhetnek: megjelent egy olyan okostelefon, amely a fizikai billentyűzet élményét hozza vissza a modern Android világába...

csütörtök 19:17

Az emberiség 60 ezer éve mérgezett nyílhegyekkel vadászott

Új kutatások szerint az emberek sokkal hamarabb kezdték mérgezett nyílhegyeket használni, mint azt korábban gondolták – az eddigi legrégebbinek hitt, 6800 éves példányok helyett már 60 ezer évvel ezelőtt is használtak ilyen halálos fegyvereket Dél-Afrikában...

csütörtök 19:01

A Copilot már a vásárlásra is rábeszél

A Microsoft új funkcióval bővíti Copilot chatbotját: mostantól közvetlenül a beszélgetés során lehet vásárolni, anélkül, hogy külön webshopokra vagy boltokra lenne szükség...

csütörtök 18:50

Az MI-támadások végtelen körforgása: a ChatGPT ismét adatokat szivárogtat

🕵 Bár a nagy nyelvi modellek, mint a ChatGPT, látványos fejlődésen mentek keresztül az elmúlt években, a biztonsági kihívásokkal továbbra is küzdenek...

csütörtök 18:34

Az akihabarai bolt kétségbeesetten könyörög régi PC-kért: mindenből kifogytak

💻 Tokió híres elektronikai negyedében, Akihabarában most már szó szerint kincset érnek a régi PC-k...

csütörtök 18:17

Az MI-verseny új fejezete: a Marvell felvásárolta az XConn‑t

A Marvell nagy dobással jelentkezett: megvásárolta az XConn Technologies-t, ezzel két kulcsfontosságú technológiai területen is előrelépett...

csütörtök 18:01

Az OpenAI elleni perben Musk beszáll a harcba

Elon Musk, a világ leggazdagabb embere és az OpenAI egyik társalapítója, most bíróságon harcol a ChatGPT fejlesztői ellen, mert szerinte a csapat megszegte eredeti nonprofit küldetését, amikor profitorientált vállalattá alakult...

csütörtök 17:49

A perzselő ausztrál hőség újabb pusztító bozóttüzekkel fenyeget

Ausztráliát most olyan hőhullám sújtja, amely súlyos bozóttüzek kitörésével fenyeget, miután a hőmérséklet az ország délkeleti részein több helyen is 40 °C fölé emelkedett...

csütörtök 17:34

Az akkumulátorok újrahasznosítása a jövőnk záloga

🔋 Hihetetlen, de igaz, hogy az életünk egyre nagyobb részét akkumulátorok hajtják – legyen szó a zsebünkben lapuló okoseszközről, vagy éppen adatközpontokról, katonai rendszerekről, mikrohálózatokról...

csütörtök 17:17

Az új Volvo EX60 644 km-t megy, és villámgyorsan tölt

🚗 A hónap végén mutatkozik be a Volvo legújabb elektromos SUV-je, az EX60, amely több úttörő megoldást hoz a villanyautók világába...

csütörtök 17:03

Az MI-modellek egyre inkább ugyanúgy látják a világot

👁 Érdemes megvizsgálni, miként érzékeli és dolgozza fel a valóságot az MI az emberi agyhoz hasonlóan...

csütörtök 16:49

Az Exchange Online megint döcög: leáll az IMAP4-es levelezés

📦 A Microsoft újabb leállással küzd az Exchange Online-ban, amely miatt sok felhasználó nem tudja elérni postafiókját IMAP4-en keresztül...

csütörtök 16:34

Visszatér az egyensúly az ingatlanpiacra – de meddig?

🏡 Az utóbbi negyedévben az amerikai ingatlanpiac lassú, de jelentős átalakuláson megy keresztül: a vásárlók és eladók közötti erőviszonyok kiegyenlítődnek...

csütörtök 16:18

A pénztárcabarát okosizzók párbaja: Lifx vagy Philips Hue Essential?

💡 A CES kiállításon idén is a legnagyobb techcégek legújabb termékei kaptak főszerepet...

csütörtök 16:02

Az új Gmail mindent tud: MI-válaszok, nyelvi ellenőrzés – nem ingyen

📧 A Gmail mostantól olyan okosan válaszolja meg a leveleidben feltett kérdéseidet, mint egy Google-keresés – csak épp MI-vel és fizetős verzióban...