Sokkoló: Az MI keresők több mint 60%-ban hamis információkat terjesztenek
A Columbia Journalism Review új kutatása azt mutatja, hogy a generatív MI alapú keresők megdöbbentően pontatlanok. A vizsgált nyolc MI-alapú kereső a hírkereséses lekérdezések több mint 60 százalékára adott hibás választ. Ez különösen aggasztó, mivel az amerikaiak közel negyede már MI modelleket használ a hagyományos keresőmotorok helyett.
Versengés a megbízhatatlanságban
A tesztelt platformok teljesítménye jelentősen eltért egymástól. A Perplexity a lekérdezések 37 százalékában közölt téves információt, míg a hivatkozott cikkek 67 százalékát helytelenül azonosította. A negatív csúcstartó a Grok 3, amely döbbenetes 94 százalékos hibaaránnyal “büszkélkedhet”. Veszélyes tendencia, hogy amikor az MI modellek nem rendelkeznek megbízható információval, gyakran hihetően hangzó, de valótlan vagy spekulatív válaszokat generálnak.
Ironikus módon a fizetős verziók bizonyos szempontból még rosszabbul teljesítettek. A Perplexity Pro (havi 20 dollár) és prémium szolgáltatása (havi 40 dollár) magabiztosabban terjesztett téves információkat, mint ingyenes változataik. Bár több kérdésre adtak helyes választ, a bizonytalan területeken mutatott túlzott magabiztosságuk miatt összességében magasabb hibaarányt produkáltak.
Etikai és forráskezelési problémák
A kutatók feltárták, hogy egyes MI eszközök figyelmen kívül hagyták a robot.txt beállításokat, amelyekkel a kiadók az illetéktelen hozzáférést próbálják megakadályozni. A Perplexity például helyesen azonosította mind a 10 fizetőfalas National Geographic tartalmat, annak ellenére, hogy a magazin kifejezetten megtiltotta webcrawlereinek a hozzáférést.
Még amikor forrásokat idéztek, gyakran a Yahoo News-hoz hasonló aggregátor oldalakhoz irányították a felhasználókat az eredeti kiadói oldalak helyett. Ez olyan esetekben is előfordult, amikor a kiadóknak hivatalos licencszerződéseik voltak MI cégekkel.
Az URL-hamisítás különösen súlyos problémaként jelentkezett. A Google Gemini és a Grok 3 hivatkozásainak több mint fele kitalált vagy hibás URL-ekhez vezetett. A Grok 3 esetében a tesztelt 200 hivatkozásból 154 hibás linkre mutatott.
A kiadók válaszút előtt állnak: ha blokkolják az MI webcrawlereket, elveszíthetik a hivatkozásokat, ha engedélyezik őket, tartalmaikat széles körben újrahasznosíthatják anélkül, hogy ez látogatottságot generálna saját oldalaikra.
Mark Howard, a Time operatív igazgatója aggódik az átláthatóság hiánya miatt, ugyanakkor bizakodó: “A termék most van a legrosszabb állapotban, ennél csak jobb lesz.” Howard ugyanakkor a felhasználókat is bírálta: “Ha bárki úgy gondolja, hogy ezek az ingyenes termékek 100 százalékosan pontosak lesznek, akkor szégyellnie kellene magát.”
Az OpenAI és a Microsoft reagáltak a megállapításokra, de közvetlenül nem foglalkoztak a konkrét problémákkal. Az OpenAI ígéretet tett a kiadók támogatására, míg a Microsoft közölte, hogy betartja a Robot Exclusion Protocols előírásait.
Kezdetben a digitális vásárlás személyes választásokra és emberi döntésekre épült. Napjainkban azonban Kína online piacain egyre inkább átadják a feladatokat önállóan működő MI-ügynököknek, amelyek nemcsak ajánlatokat tesznek, hanem teljes tranzakciókat bonyolítanak le a felhasználók helyett – gyakorta úgy, hogy ők maguk már a kijelzőt sem érintik...
Tipikus eset, amikor egy fejlesztői platform rosszul dokumentált, elavult információkat tartalmaz, és ezek az adatok rendre bekerülnek a mesterséges intelligenciát betanító rendszerek tudástárába is...
Sokan várták már azt a fejlesztést, amely a Kindle Scribe készüléket a digitális jegyzetelők élvonalába repítheti: mostantól lehetőség van okos alakzatok használatára, amelyek azonnal szép, szabályos formát adnak a vázlatoknak...
Az emberi test folyamatosan megújul: a vörösvértestek négyhavonta, a bőr és a bél nyálkahártyájának sejtjei néhány nap vagy hét alatt teljesen kicserélődnek...
💪 Érdemes megérteni, hogy a modern fitneszipar által kínált bonyolult gépek, hosszú futópados edzések vagy trendi kondibérletek nem feltétlenül kínálják a legjobb megoldást annak, aki erős és egészséges szeretne maradni ötvenéves kor felett...
🚲 Például amikor egy komoly bringás baleset után újragondolod, hogyan navigálsz a városban biciklivel, hamar rájössz, hogy a kormányra szerelt okostelefon nem a legbölcsebb választás...
📈 Hihetetlen, de mégis igaz, hogy a bitcoin az utóbbi két hónap legmagasabb árfolyamát érte el, közel 78 000 dolláron (27,7 millió forint), miután kedvező hírek érkeztek az iráni háború lezárásának lehetőségéről és a Hormuzi-szoros megnyitásáról...
A vállalatok zöme továbbra is tehetetlen a harmadik szintű MI-ügynökök jelentette fenyegetésekkel szemben, miközben ezek az automatizált rendszerek egyre bátrabban lépnek át a biztonsági vonalakon...
🔴 Egy, a Földtől 500 millió fényévre található galaxisban két óriási fekete lyuk sodródik végzetes összeütközés felé, amelynek hatásait akár száz éven belül is megérezheti a Föld...
🚀 Új kutatások szerint a Colorado-folyó nem egyből vájta ki a Grand Canyont, hanem előbb egy hatalmas tóban gyűlt össze, és csak később szakadt át, hogy megkezdje ma ismert útját a mély szurdokon keresztül...
A dizájnszoftverek piacára új kihívó érkezett: az Anthropic bemutatta legújabb fejlesztését, a Claude Design-t, amely képes teljes értékű, vizuálisan kidolgozott terveket, interaktív prototípusokat, prezentációkat, one-pagereket és marketinganyagokat készíteni egyszerű szöveges utasításokra...
💰 A Kirgizisztánban bejegyzett, amerikai szankciókkal sújtott Grinex kriptotőzsde bejelentette, hogy leállítja működését, miután 5,5 milliárd forint (15 millió dollár) értékű vagyont loptak el tőle – állítólag „barátságtalan országok” titkosszolgálatainak közreműködésével...
A NASA ismét bekapcsolódott az Európai Űrügynökség (ESA) Rosalind Franklin marsjárójának küldetésébe, amelynek célja az élet nyomainak keresése a vörös bolygón...
💳 Az ellopott bankkártyaadatokkal kereskedő alvilági piac mindig is ingatag, kiszámíthatatlan terepnek számított, ahol még a tapasztalt bűnözők is gyakran esnek csalás, lehúzás vagy hatósági lebuktatás áldozatául...
Áprilisban jelentős mérföldkőhöz érkezett a Google: az Android Canary 2604 verziója már nemcsak a legújabb Pixel 8-as sorozaton fut, hanem immár elérhető a Pixel 6 és Pixel 7 szériára, valamint a Pixel Foldra és a Pixel Tabletre is...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Sight Words: Dolch Coach (iPhone/iPad)Ez a játék a Dolch Sight Words mind az öt szintjét lefedi, így segít elsajátítani az automatikus szófelismerést, ami elengedhetetlen a funkcionális írástudáshoz...
Óriási lendülettel indult az MI-őrület az Egyesült Államokban, a világ techközpontjai dollárszázmilliárdokat ölnek egyre nagyobb és energiaéhes adatközpontok építésébe...