Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek

Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.

Versengés a megbízhatatlanságban

A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.

Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.

Etikai és forráskezelési problémák

A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.

Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.

Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.

Döntéskényszerben a kiadók

A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.

Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”

Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.

  • Te mit gondolsz arról, ha egyre több cég hagyatkozik generatív MI-alapú keresőkre a hagyományos keresők helyett?
  • Te mit tennél, ha a céged adatait illetéktelenül használná egy MI kereső, megsértve ezzel a robot.txt beállításaidat?


Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 13:49

Az áradások árnyékában: Ázsia jövője a klímaváltozás markában

Az elmúlt hónapban Indonéziát és Srí Lankát sújtó két trópusi vihar összesen közel 1600 ember életét követelték, miután hatalmas esőzéseket és földcsuszamlásokat okoztak...

MA 13:01

Az MI és a robotika új korszakot hoz a brit kutatólaborokban

A Google DeepMind jövőre megnyitja első automatizált kutatólaborját az Egyesült Királyságban, ahol MI-t és robotikát vetnek be a kísérletekhez...

MA 12:34

Az Adobe Photoshop mostantól ingyen használható a ChatGPT-ben

Érdemes megérteni: forradalmi változás történt. Az Adobe legnépszerűbb kreatív és produktivitási alkalmazásai, köztük a Photoshop, az Express és az Acrobat, mostantól közvetlenül elérhetők a ChatGPT-ben...

MA 12:17

Az eltűnt Mars-szonda rejtélye: a NASA tanácstalan

A NASA váratlanul elveszítette a kapcsolatot a Maven nevű űrszondával, amely már több mint tíz éve kering a Mars körül...

MA 12:01

Az életmentő Mars-szonda leállt: bajban a NASA

A NASA egyik kulcsfontosságú marsi műholdja, a MAVEN, december 6-án váratlanul elnémult, amikor a Mars túlsó oldalán járt – azon az oldalon, amelyik nem néz a Föld felé...

MA 11:49

Az Apple TV és az Apple Music egyszerre omlott össze

Délután néhány felhasználó számára elérhetetlenné váltak az Apple Music és az Apple TV, ráadásul az Apple TV Channels funkciója sem működött...

MA 11:33

Az új Teams riaszt, ha gyanús a külső forgalom

A Microsoft egy friss biztonsági funkción dolgozik a Teamsben, amely képes elemezni a gyanús forgalmat külső domainekkel, ezzel segítve az IT-adminisztrátorokat a potenciális biztonsági kockázatok kiszűrésében...

MA 11:17

A DroidLock lecsap: androidos telefonokat zárol, váltságdíjat követel

Egy frissen felfedezett androidos kártevő, a DroidLock zárolja az áldozatok készülékeit, miközben az SMS-ekhez, híváslistákhoz, névjegyekhez, hangfelvételekhez is hozzáfér, sőt, akár törölheti is az adatokat...

MA 11:01

Az Nvidia tényleg a saját chipjei után kémkedik?

Az Nvidia új szoftveres megoldáson dolgozik, amellyel ellenőrizheti, pontosan melyik országban vannak az MI-chipjei – nem véletlenül, mivel egyre többen vádolják a céget azzal, hogy processzorait Kínába csempészik...

MA 10:57

Az SK Hynix amerikai hódításra készül az MI-őrület csúcsán

👑 A dél-koreai SK Hynix, amely az Nvidia legnagyobb memóriagyártó beszállítója, komolyan fontolgatja, hogy tőzsdére lép az Egyesült Államokban...

MA 10:50

Az űr csendje lecsapott: megszakadt a kapcsolat a MAVEN-nel a Marsnál

A NASA elveszítette a kapcsolatot a Mars körül keringő MAVEN szondával, miután az a bolygó mögé került, és visszatérése után sem sikerült újra elérni...

MA 10:44

Az űripar aranyláza: a SpaceX tőzsdére lép

🚀 A SpaceX évekig elutasította a tőzsdei bevezetést, most azonban mégis IPO-ra készül – és ez óriási változás Elon Musk gondolkodásában...

MA 10:37

Az űr az új adatközpont, és már mindenki oda tart

A technológiai cégek versenyt futnak, hogy az első adatközpontokat az űrbe telepítsék...

MA 10:22

Az Oracle önti a pénzt, az MI aggasztja a befektetőket

💸 Az Oracle jelentősen megemelte a mesterséges intelligenciához kapcsolódó jövőbeli kiadásait: a 2026-os pénzügyi évben 15 milliárd dollárral többet tervez befektetni a felhőinfrastruktúrába, mint korábban becsülték...

MA 10:02

Az őseink már 400 ezer éve tüzet gyújtottak

A modern ember számára magától értetődő, hogy egy gyufa vagy egy öngyújtó segítségével könnyedén tüzet varázsolhat, őseinknek azonban kemény küzdelem árán kellett ezt a tudást elsajátítaniuk...

MA 09:58

Az indiai MI-láz: egy nap alatt 20 billió forint!

India egyetlen nap alatt több mint 20 billió forint (50 milliárd dollár) értékű befektetést kapott a legnagyobb technológiai cégektől, mivel az ország egyre fontosabb szereplővé válik a globális MI- és felhőalapú infrastruktúrában...

MA 09:51

Az új Wi‑Fi‑király: tényleg mindent letarol a Flint 2?

A GL.iNet GL-MT6000, más néven Flint 2 meglepő teljesítményt nyújt a Wi‑Fi-routerek között, főleg amikor kiderül, milyen erőteljes chipset dolgozik benne...

MA 09:44

Az eltűnt jel: a NASA elvesztette a kapcsolatot a marsi szondával

🚨 A NASA drámai bejelentést tett: elveszítette a kapcsolatot a három, a Mars körül keringő űrszonda egyikével, a MAVEN-nel (Mars Atmosphere and Volatile Evolution)...