Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.
Versengés a megbízhatatlanságban
A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.
Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.
Etikai és forráskezelési problémák
A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.
Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.
Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.
A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.
Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”
Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.
🌊 Az Északi-tenger feneke alatt, 700 méter mélységben, Yorkshire partjaitól mintegy 130 km-re egy rejtett, három kilométer széles kráter található, amelynek eredete több mint húsz éve komoly tudományos vitákat váltott ki...
Egy lényeges szempont, hogy az emberek bizalmatlanokká válnak az MI-hangokkal szemben abban a pillanatban, amikor felismerik, hogy nem egy valódi ember beszél...
A nemzetközi űrverseny egyre izgalmasabbá válik, hiszen Kína és az Egyesült Államok versengve készülnek arra, hogy először embereket juttassanak vissza a Holdra...
Érdemes megvizsgálni, hogy egyre kifinomultabb módszerekkel támadják az okostelefonokat: most egy olyan androidos kártevő tűnt fel, amely Starlink-alkalmazásnak álcázza magát, miközben valójában a BeatBanker nevű csaló program rejtőzik mögötte...
Az Amazon bővíti egészségügyi MI-asszisztense, a Health AI elérhetőségét: mostantól nemcsak a One Medical alkalmazásban, hanem közvetlenül az Amazon weboldalán és alkalmazásában is hozzáférhető...
🚗 A Ford új lendületet ad a céges járműparkok irányításának: a Ford Pro AI névre hallgató, mesterséges intelligenciát használó szolgáltatás mostantól a Ford Pro telematikai szoftverébe épül be...
💉 Jellemző példa erre, hogy a világ egyik legveszélyesebb gyermekkori bélfertőzése ellen most először született hatékony védelem: a skandináv fejlesztésű ETVAX vakcina áttörő eredményeket mutat a halálos bélbaktérium, az enterotoxigén E...
📷 Az utóbbi években a Google minden termékébe minél több mesterséges intelligenciát (MI) igyekezett beépíteni, azonban a felhasználók nem mindig örülnek ennek...
🚀 Oké, szóval megérkezett a Chrome-ba épített Gemini chatbot Kanadába, Indiába és Új-Zélandra, ráadásul már több mint ötven nyelven lehet vele csevegni – köztük franciául, gujaratiul, hindiül, spanyolul és még sok más nyelven –, csakhogy a magyaroknak még várniuk kell egy kicsit...
💻 Dublin közvetlen közelében, Írország szívében indul el Európa első olyan adatközpontja, amely teljesen független, úgynevezett szigetüzemű mikrohálóra támaszkodik az energiaellátásban...
A bomló holttesteken nyüzsgő lárvák látványa nem túl gyomorkímélő, de a helyszínelők számára ezek az apró élőlények kulcsfontosságú bizonyítékok lehetnek...
Már tavaly novemberben is betelt a pohár: az Amazon nekiment a Perplexity nevű MI‑startupnak, és megtiltotta, hogy a Comet nevű MI‑böngészője engedély nélkül a felhasználók helyett vásároljon a webáruházukban...
🛠 A Microsoft kiadta a Windows 10 KB5078885 kumulatív biztonsági frissítést, amely számos fontos sebezhetőséget orvosol, köztük két aktívan kihasznált nulladik napi sérülékenységet, valamint egy olyan problémát, amely megakadályozta egyes eszközök leállítását vagy hibernálását...
Egyedülálló égi látványosságnak lehettek szemtanúi Németország és több szomszédos ország lakói vasárnap este, amikor egy meteor hatalmas tűzgömbbé vált az égen, majd látványos robbanással végződött...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben egy kisváros különös lakóinak mindennapi élete és magánéleti drámái összefonódnak természetfeletti eseményekkel...
Jellemző példa erre, hogy ma már sokan tartanak attól, mit osztanak meg egy felhőalapú MI-vel, vagy attól is tartanak, hogy érzékeny genetikai adataik idegen kezekbe kerülnek...
Érdemes megérteni, hogy a Lenovo legújabb SFF (small form factor) munkaállomása, a ThinkStation PGX, nemcsak mérnöki bravúr, hanem komoly stratégiai döntés is...
📁 Na, most aztán forr a levegő az USA-ban: egy DOGE-mérnök állítólag elcsente a Társadalombiztosítási Hivatal (Social Security Administration, SSA) adatbázisát egy apró pendrive-on – és benne több mint 500 millió élő és elhunyt amerikai minden féltve őrzött adata...
💰 Amikor az online előrejelző piacok berobbantak a köztudatba, senki sem gondolta volna, hogy két ilyen karakteres rivális vág bele a jövő fogadásaiért folyó harcba...