Az MI egyre többet képzelődik – és ez baj?

Az MI egyre többet képzelődik – és ez baj?
Az MI fejlődésével egyre gyakrabban fordul elő, hogy hamis vagy hibás információkat közöl. Az OpenAI legújabb, legerősebb modelljei, az o3 és az o4-mini a PersonQA-teszten 33%-ban, illetve 48%-ban hallucináltak – ez több mint kétszerese a korábbi o1 típus hibaarányának. Az új generáció valóban jobb válaszokat tud adni, de ezzel párhuzamosan nőtt a tévedések száma is. Ennek következtében egyre nagyobb kérdés, hogy mennyire bízhatunk meg a nagy nyelvi MI-chatbotokban, alkalmazásokban és az általuk szolgáltatott tartalmakban. Ha egy rendszer ugyanolyan meggyőzően ad elő kitalációkat, hamis tényeket, idézeteket vagy eseményeket, mint a valódi adatokat, könnyen félrevezetheti a felhasználókat. Ez különösen akkor probléma, ha ellenőrzés nélkül hagyatkozunk ezekre az információkra.

Az MI-nek muszáj kreatívnak lennie

A fejlett MI-modellek lényege, hogy bonyolult feladatokat is képesek megoldani: szétbontják azokat kisebb részekre, majd ezekre kidolgoznak megoldásokat. Nem csupán valószínűségi alapon megtanult válaszokat adnak vissza, hanem saját stratégiákat dolgoznak ki, hasonlóan az emberi gondolkodáshoz.

Egy igazán kreatív, új ötlet vagy megoldás azonban elképzeli, vagyis lényegében „hallucinálja” is a válaszokat – e nélkül az MI csak a betanult adatbázis szigorú határain belül mozogna. Egy MI-kutató úgy fogalmazza meg: minden egyes LLM által generált válasz hallucináció, a különbség csupán annyi, hogy némelyik eltalálja a valóságot.

Ha csak azt tudná visszaadni, ami már volt, soha nem írna például dalszöveget egy olyan konceptalbumhoz, amely az MI-szingularitásról szól Snoop Dogg és Bob Dylan stílusában. Az imagináció, az ötletelés „emberi módja” így alapfeltétele az MI kreativitásának is.

Amikor már nem elég jó a fantázia

A gond akkor kezdődik, amikor a kitalált, téves információkat is ugyanolyan magabiztosan közli az MI, mint a valós adatokat, és a felhasználók ezt ellenőrzés nélkül elfogadják. Ez főleg olyan területeken életveszélyes, ahol a pontosság kulcsfontosságú, például az orvostudományban, a jogban vagy a pénzügyekben. Ezeknél a modelleknél nemcsak kevésbé nyilvánvaló hibákkal, hanem sokkal rafináltabb, nehezebben felismerhető tévedésekkel is találkozunk. Az MI egyre inkább beépíti a hibás információkat logikusnak tűnő érvelésekbe és történetekbe, így azok szinte „észrevétlenül” válnak meggyőzővé.

Ráadásul egyelőre azt sem tudjuk pontosan, hogyan születnek ezek a válaszok a modellekben – az MI működése továbbra is rejtély, akárcsak az emberi agy logikája. Például, amikor egy MI pénzügyi dokumentumot foglal össze, valójában fogalmunk sincs, miért dönt egyik vagy másik szó vagy információ mellett – vagy hogy miért hibázik.

Nem csoda, hogy a cégek ügyfélszolgálati chatbotjai rendszeresen találnak ki sosem létezett szabályzatokat, vagy hivatkoznak fiktív forrásokra.

Lehet egyáltalán kevesebb „álomvilágot” elérni?

A legtöbb szakértő szerint ezek a fantáziálások teljesen soha nem szoríthatók ki az MI-ből, de mérsékelni lehet őket. Az egyik leghatékonyabb módszer az úgynevezett „retrieval-augmented generation”, amikor a modell válaszait ellenőrzött, külső adatbázisokhoz kötjük. Így az MI a válaszadás előtt utánanéz a valós tényeknek.

Emellett segít, ha a modelleket önellenőrzésre ösztönözzük: például arra kérjük, hogy hasonlítsa össze több nézőpontot, vagy lépésről lépésre vezesse le a válaszát. Az emberi vagy MI-értékelők visszacsatolása, a „bízd a szakértőre” szemlélet, valamint az önbizalom szintjének jelzése (például, ha nem tud valamit, inkább ne válaszoljon biztosan) mind csökkentik a hibaarányt.

Mivel azonban a kreativitás és a hallucináció kéz a kézben járnak, örökre csak mérsékelni tudjuk majd az MI félrevezető válaszait. Ezeket a válaszokat továbbra is ugyanolyan szkepszissel kell kezelnünk, ahogyan egy ismeretlen ember állításait is – ebben hasonlít egymásra a kétféle gondolkodás.

2025, adminboss, www.livescience.com alapján

  • Te mit éreznél, ha egy MI által adott válasz tényleg félrevezetne valakit?
  • Te hogyan ellenőriznéd az MI által generált információkat?
  • Te szerinted meddig lehet engedni, hogy egy MI kreatív legyen, ha az néha tévedésekkel jár?


Legfrissebb posztok

MA 18:49

Az egyszerű szokások, amelyek akár 8 évvel fiatalítják az agyat

💡 Új kutatás szerint az agy valós életkora sokkal inkább függ a napi szokásoktól, mint a születési dátumtól...

MA 18:34

Az ősi himalájai égetés visszahozhatná az erdők életét

A tél beköszöntével december és január folyamán Uttarakhand hegyvidéki régióiban a helyi közösségek régi hagyomány szerint irányított égetésekkel újítják meg a hegyi legelők füvét...

MA 18:17

Az Apple újra foltoz: súlyos MI-támadás érte

Két komoly, eddig ismeretlen sebezhetőséget javított az Apple, miután egy rendkívül kifinomult támadást fedeztek fel, amely akár magas rangú személyek elleni kibertámadás része is lehetett...

MA 18:03

Az évszázad forrósága, a hobbitok kihalásának rejtélye és a K-vitamin-vita

🌎 Rekordközeli hőmérsékletek, újabb járványügyi fejlemények, valamint egy közel 50 000 éves kihalás titkának megfejtése – az elmúlt hét tudományos hírei nemcsak izgalmasak, hanem meghatározók is mindannyiunk jövője szempontjából...

MA 17:49

Az olcsó SSD-k kora lejárt?

Vészesen közeledik a korszak vége azok számára, akik olcsó SSD-t keresnek: a hírek szerint a Samsung hamarosan leállítja a költséghatékony SATA SSD-k gyártását...

MA 17:17

Az űrben káosz: veszélyes kínai műhold a Starlink közelében

A SpaceX súlyos aggályokat fogalmazott meg, miután egy kínai rakétával pályára állított műhold mindössze 200 méterre haladt el az egyik működő Starlink-műhold mellett, 560 kilométeres magasságban...

MA 17:02

Az MI-fejlesztésekbe tovább ömlik a pénz

A vezetők többsége úgy látja, hogy az MI-beruházások nemcsak elbocsátásokat hoznak, hanem új munkahelyeket is teremtenek – még ha eddig kevesebb projekt vált is be, mint várták...

MA 16:50

Az év végi hajrában így döntenek jobban a vezetők decemberben

📈 Decemberben a cégeknél szinte csodával határos változás történik: a hónapokig húzódó döntések hirtelen megszületnek, projekteket hagynak jóvá, költségvetéseket véglegesítenek, és végre pont kerül a sokáig vitatott ügyek végére...

MA 16:33

Az MI új aranybányája: Fél év alatt elszálltak a bevételek

Brendan Foody mindössze 19 évesen alapította két középiskolai barátjával a Mercor nevű céget, hogy segítse ismerőseik induló vállalkozásait szoftvermérnökök felvételével, főként külföldről...

MA 16:17

A legújabb Windows-frissítés lebénítja a vállalati üzenetküldőket

🔴 A Microsoft megerősítette, hogy a 2025. decemberi biztonsági frissítések súlyos problémát okoznak a Message Queuing (MSMQ) szolgáltatásban, amely leginkább a nagyvállalati alkalmazásokat és az Internet Information Services (IIS) webhelyeket érinti...

MA 16:01

Az újabb hekkertámadás a francia minisztériumok ellen: veszélyben az érzékeny e-mailek

A francia Belügyminisztérium elismerte, hogy kibertámadás érte a tárca e-mail-szervereit: az ismeretlen támadók több dokumentumfájlokhoz is hozzáfértek...

MA 15:52

A pénztárcabarát okoskarkötő, amit minden kezdő sportoló imád

Aki most kezdene neki a rendszeres mozgásnak vagy csak szeretné a hétköznapokat sportosabbá és egészségesebbé tenni, annak az új Xiaomi Smart Band 10 több szempontból is kiváló választás lehet...

MA 15:33

Az Apple TV új sztárja: a Pluribus mindent visz

🎬 Most már hivatalos: a Vince Gilligan (Totál szívás [Breaking Bad]) által jegyzett Pluribus minden korábbi sikert felülmúlt az Apple TV+-on, még a legendás Ted Lasso és a Különválás (Severance) nézettségét is lekörözve...

MA 15:17

Az új React2Shell-hullámhoz sorra csatlakoznak a kínai hackercsoportok

A közelmúltban a Google fenyegetéselemző csapata további öt kínai hackercsoportot azonosított, amelyek a „React2Shell” nevű, rendkívül súlyos távoli kódfuttatási sebezhetőséget kihasználó támadásokhoz kapcsolódnak...

MA 15:04

Az új Leica M EV1: a távmérő bűvölete helyett kíméletlen praktikum

Erre utal többek között az, hogy a Leica legújabb M sorozatú fényképezőgépe, az M EV1, jelentős változtatást hoz a legendás rendszerbe: a jól ismert optikai távmérőt modern elektronikus kereső (EVF) váltja...

MA 14:50

Az XRP ETF-ek dacolnak a kriptópánikkal

Az utóbbi időszakban, amikor a Bitcoin- és Ethereum-ETF-ekből jelentős összegeket vontak ki, az XRP ETF-ek minden napra újabb pénzbeáramlást könyvelhettek el...

MA 14:35

A Kindle új trükkje: a könyv, ami visszabeszél

Az Amazon bemutatta a Kindle alkalmazás új MI-alapú funkcióját, amelynek segítségével olvasás közben bármilyen kérdésre választ kaphatsz a könyv tartalmával kapcsolatban – anélkül, hogy spoilerekkel elrontaná az olvasás élményét...

MA 14:18

Az Apple ajándékkártyája pokollá tette a digitális életünket

Hihetetlen, de mégis igaz, hogy egy közel harmincéves Apple-rajongó mindenét elvesztette egyetlen ajándékkártya miatt...

MA 14:02

Az amerikai bankok ajtót nyitnak a kriptocégeknek

🔑 Az Egyesült Államokban új korszak kezdődik a kriptovaluták és a hagyományos pénzintézetek együttműködésében...