Az MI egyre többet képzelődik – és ez baj?

Az MI egyre többet képzelődik – és ez baj?
Az MI fejlődésével egyre gyakrabban fordul elő, hogy hamis vagy hibás információkat közöl. Az OpenAI legújabb, legerősebb modelljei, az o3 és az o4-mini a PersonQA-teszten 33%-ban, illetve 48%-ban hallucináltak – ez több mint kétszerese a korábbi o1 típus hibaarányának. Az új generáció valóban jobb válaszokat tud adni, de ezzel párhuzamosan nőtt a tévedések száma is. Ennek következtében egyre nagyobb kérdés, hogy mennyire bízhatunk meg a nagy nyelvi MI-chatbotokban, alkalmazásokban és az általuk szolgáltatott tartalmakban. Ha egy rendszer ugyanolyan meggyőzően ad elő kitalációkat, hamis tényeket, idézeteket vagy eseményeket, mint a valódi adatokat, könnyen félrevezetheti a felhasználókat. Ez különösen akkor probléma, ha ellenőrzés nélkül hagyatkozunk ezekre az információkra.

Az MI-nek muszáj kreatívnak lennie

A fejlett MI-modellek lényege, hogy bonyolult feladatokat is képesek megoldani: szétbontják azokat kisebb részekre, majd ezekre kidolgoznak megoldásokat. Nem csupán valószínűségi alapon megtanult válaszokat adnak vissza, hanem saját stratégiákat dolgoznak ki, hasonlóan az emberi gondolkodáshoz.

Egy igazán kreatív, új ötlet vagy megoldás azonban elképzeli, vagyis lényegében „hallucinálja” is a válaszokat – e nélkül az MI csak a betanult adatbázis szigorú határain belül mozogna. Egy MI-kutató úgy fogalmazza meg: minden egyes LLM által generált válasz hallucináció, a különbség csupán annyi, hogy némelyik eltalálja a valóságot.

Ha csak azt tudná visszaadni, ami már volt, soha nem írna például dalszöveget egy olyan konceptalbumhoz, amely az MI-szingularitásról szól Snoop Dogg és Bob Dylan stílusában. Az imagináció, az ötletelés „emberi módja” így alapfeltétele az MI kreativitásának is.

Amikor már nem elég jó a fantázia

A gond akkor kezdődik, amikor a kitalált, téves információkat is ugyanolyan magabiztosan közli az MI, mint a valós adatokat, és a felhasználók ezt ellenőrzés nélkül elfogadják. Ez főleg olyan területeken életveszélyes, ahol a pontosság kulcsfontosságú, például az orvostudományban, a jogban vagy a pénzügyekben. Ezeknél a modelleknél nemcsak kevésbé nyilvánvaló hibákkal, hanem sokkal rafináltabb, nehezebben felismerhető tévedésekkel is találkozunk. Az MI egyre inkább beépíti a hibás információkat logikusnak tűnő érvelésekbe és történetekbe, így azok szinte „észrevétlenül” válnak meggyőzővé.

Ráadásul egyelőre azt sem tudjuk pontosan, hogyan születnek ezek a válaszok a modellekben – az MI működése továbbra is rejtély, akárcsak az emberi agy logikája. Például, amikor egy MI pénzügyi dokumentumot foglal össze, valójában fogalmunk sincs, miért dönt egyik vagy másik szó vagy információ mellett – vagy hogy miért hibázik.

Nem csoda, hogy a cégek ügyfélszolgálati chatbotjai rendszeresen találnak ki sosem létezett szabályzatokat, vagy hivatkoznak fiktív forrásokra.

Lehet egyáltalán kevesebb „álomvilágot” elérni?

A legtöbb szakértő szerint ezek a fantáziálások teljesen soha nem szoríthatók ki az MI-ből, de mérsékelni lehet őket. Az egyik leghatékonyabb módszer az úgynevezett „retrieval-augmented generation”, amikor a modell válaszait ellenőrzött, külső adatbázisokhoz kötjük. Így az MI a válaszadás előtt utánanéz a valós tényeknek.

Emellett segít, ha a modelleket önellenőrzésre ösztönözzük: például arra kérjük, hogy hasonlítsa össze több nézőpontot, vagy lépésről lépésre vezesse le a válaszát. Az emberi vagy MI-értékelők visszacsatolása, a „bízd a szakértőre” szemlélet, valamint az önbizalom szintjének jelzése (például, ha nem tud valamit, inkább ne válaszoljon biztosan) mind csökkentik a hibaarányt.

Mivel azonban a kreativitás és a hallucináció kéz a kézben járnak, örökre csak mérsékelni tudjuk majd az MI félrevezető válaszait. Ezeket a válaszokat továbbra is ugyanolyan szkepszissel kell kezelnünk, ahogyan egy ismeretlen ember állításait is – ebben hasonlít egymásra a kétféle gondolkodás.

2025, adminboss, www.livescience.com alapján

  • Te mit éreznél, ha egy MI által adott válasz tényleg félrevezetne valakit?
  • Te hogyan ellenőriznéd az MI által generált információkat?
  • Te szerinted meddig lehet engedni, hogy egy MI kreatív legyen, ha az néha tévedésekkel jár?


Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 09:36

Az év legnagyobb csillaghullása jön: érkeznek a Geminidák

✨ December közepén a Geminidák meteorraja világítja be az eget, így érdemes lesz egy pillanatra kiszakadni a karácsonyi rohanásból...

MA 09:29

Az iMessage titkosítása: ezért nem férhet hozzá senki az üzeneteidhez

🔒 Amikor valaki új iMessage-beszélgetést indít, a készülék először az ismerős telefonszámát vagy e-mail-címét kéri...

MA 09:22

A hatalmas Dell Pro Max 18 Plus mindent visz – vagy mégsem?

A Dell Pro Max 18 Plus egészen elképesztő méreteivel és erejével magára vonja a figyelmet...

MA 09:14

Az áttörés: újraindulhat az inzulintermelés 1-es típusú cukorbetegeknél

💜 Új reményt hozhat az 1-es típusú cukorbetegség kezelésében egy forradalmi sejtátültetés, amely során genetikailag módosított, inzulintermelő sejteket juttattak egy páciens szervezetébe...

MA 09:08

A nagy adatbotrány: volt alkalmazott szivárogtatta ki a Coupang adatait

Dél-Korea legnagyobb online kereskedőjét, a Coupangot idén minden idők legsúlyosabb adatvédelmi incidense rázta meg: 33,7 millió ügyfél személyes adatai kerültek illetéktelen kézbe...

MA 09:01

A grenoble-i középkori akasztófa hátborzongató titkai

🕴 A franciaországi Grenoble szélén régészek páratlan felfedezést tettek: egy 16. századi akasztófa maradványait és a hozzá tartozó tömegsírokat találták meg...

MA 08:57

A trükköző tankhajók leleplezve: így buknak le a csalók

🛡 A héten Venezuela partjainál lefoglalt olajszállító tankhajó rávilágított egy gyakran alkalmazott trükkre, amellyel a „sötét flottához” tartozó hajók igyekeznek eltüntetni a nyomukat...

MA 08:51

A hihetetlen eset: a baba a hasüregben fejlődött ki

👶 Ami először apróságnak tűnt, hamar életveszélyes helyzetbe fordult egy kaliforniai nőnél...

MA 08:43

A marsi idő követése: kemény dió

Nehéz elképzelni, mennyire bonyolult dolog lenne pontosan megmondani az időt a Marson – főleg, ha valaki ott végzi a munkáját...

MA 08:36

Az új film mellé most vírust is kapsz

💉 Leonardo DiCaprio főszereplésével idén szeptemberben jelent meg az Egyik csata a másik után (One Battle After Another) című, nagy érdeklődésre számot tartó film, amely körül a kalóztorrentek máris veszélyes hullámot indítottak el...

MA 08:29

A titokzatos üstökös zölden izzik, egyre közelebb a Földhöz

🚀 Ez a jelenség jól illusztrálható azzal, hogy a Hawaii-on található Gemini North távcső legfrissebb képei szerint az intersztelláris 3I/ATLAS üstökös egyre fényesebb és zöldebb, amint megközelíti a Földet...

MA 08:23

A csillagközi üstökös zöldre festi a hawaii égboltot

A 3I/ATLAS üstökös, a Naprendszeren kívülről érkezett különleges égi vándor újra feltűnt, miután elbújt a Nap mögött, és a hawaii Maunakea csúcsán működő Gemini North távcső lenyűgöző felvételt készített róla...

MA 08:15

Az USA lazít az MI-chiptilalmon Kínával szemben – a Huawei miatt?

Az amerikai kormány engedélyezte, hogy az Nvidia az új H200-as MI-gyorsítóit ismét Kínába exportálja, igaz, minden egyes szállítmánynál 25 százalékos vámot számítanak fel...

MA 08:08

Az orvosi kannabisz: mi igaz a hiedelmekből, mi nem?

Erre utal többek között az, hogy egy átfogó, több mint 2500 tanulmányt vizsgáló elemzés szerint a kannabisztól várt orvosi csodák többségének tudományos bizonyítékai meglehetősen gyengék...

MA 08:02

Az Oracle visszavág: szó sincs csúszásról az OpenAI-megállapodásban

Az Oracle pénteken cáfolta azokat a híreszteléseket, amelyek szerint az OpenAI számára csak 2028-ra épülne meg az új adatközpont-hálózat, és ezzel eltolódna az eredetileg 2027-re tervezett befejezés...

MA 07:58

Az újabb McDonald’s-bezárás: megállíthatatlan a gyorséttermek válsága?

🍔 Egymás után zárják be éttermeiket a legismertebb gyorsétteremláncok, köztük a McDonald’s is...

MA 07:52

Az MI‑asszisztens önmagát fejleszti: így írja át a programozást a Codex

Az OpenAI egy olyan MI-ügynököt alkotott, amely immár nemcsak a fejlesztőknek segít, hanem saját magát is folyamatosan fejleszti...

MA 07:43

A Google élő fordítása mostantól minden fülhallgatón működik

A Google Fordító komoly újítást vezetett be: mostantól bármilyen androidos telefonhoz csatlakoztatott fülhallgatóval használható az élő fordítás, nem szükséges hozzá a Pixel Buds...