2025. 06. 22., 17:15

Az MI egyre többet képzelődik – és ez baj?

Az MI egyre többet képzelődik – és ez baj?
Az MI fejlődésével egyre gyakrabban fordul elő, hogy hamis vagy hibás információkat közöl. Az OpenAI legújabb, legerősebb modelljei, az o3 és az o4-mini a PersonQA-teszten 33%-ban, illetve 48%-ban hallucináltak – ez több mint kétszerese a korábbi o1 típus hibaarányának. Az új generáció valóban jobb válaszokat tud adni, de ezzel párhuzamosan nőtt a tévedések száma is. Ennek következtében egyre nagyobb kérdés, hogy mennyire bízhatunk meg a nagy nyelvi MI-chatbotokban, alkalmazásokban és az általuk szolgáltatott tartalmakban. Ha egy rendszer ugyanolyan meggyőzően ad elő kitalációkat, hamis tényeket, idézeteket vagy eseményeket, mint a valódi adatokat, könnyen félrevezetheti a felhasználókat. Ez különösen akkor probléma, ha ellenőrzés nélkül hagyatkozunk ezekre az információkra.

Az MI-nek muszáj kreatívnak lennie

A fejlett MI-modellek lényege, hogy bonyolult feladatokat is képesek megoldani: szétbontják azokat kisebb részekre, majd ezekre kidolgoznak megoldásokat. Nem csupán valószínűségi alapon megtanult válaszokat adnak vissza, hanem saját stratégiákat dolgoznak ki, hasonlóan az emberi gondolkodáshoz.

Egy igazán kreatív, új ötlet vagy megoldás azonban elképzeli, vagyis lényegében „hallucinálja” is a válaszokat – e nélkül az MI csak a betanult adatbázis szigorú határain belül mozogna. Egy MI-kutató úgy fogalmazza meg: minden egyes LLM által generált válasz hallucináció, a különbség csupán annyi, hogy némelyik eltalálja a valóságot.

Ha csak azt tudná visszaadni, ami már volt, soha nem írna például dalszöveget egy olyan konceptalbumhoz, amely az MI-szingularitásról szól Snoop Dogg és Bob Dylan stílusában. Az imagináció, az ötletelés „emberi módja” így alapfeltétele az MI kreativitásának is.

Amikor már nem elég jó a fantázia

A gond akkor kezdődik, amikor a kitalált, téves információkat is ugyanolyan magabiztosan közli az MI, mint a valós adatokat, és a felhasználók ezt ellenőrzés nélkül elfogadják. Ez főleg olyan területeken életveszélyes, ahol a pontosság kulcsfontosságú, például az orvostudományban, a jogban vagy a pénzügyekben. Ezeknél a modelleknél nemcsak kevésbé nyilvánvaló hibákkal, hanem sokkal rafináltabb, nehezebben felismerhető tévedésekkel is találkozunk. Az MI egyre inkább beépíti a hibás információkat logikusnak tűnő érvelésekbe és történetekbe, így azok szinte „észrevétlenül” válnak meggyőzővé.

Ráadásul egyelőre azt sem tudjuk pontosan, hogyan születnek ezek a válaszok a modellekben – az MI működése továbbra is rejtély, akárcsak az emberi agy logikája. Például, amikor egy MI pénzügyi dokumentumot foglal össze, valójában fogalmunk sincs, miért dönt egyik vagy másik szó vagy információ mellett – vagy hogy miért hibázik.

Nem csoda, hogy a cégek ügyfélszolgálati chatbotjai rendszeresen találnak ki sosem létezett szabályzatokat, vagy hivatkoznak fiktív forrásokra.

Lehet egyáltalán kevesebb „álomvilágot” elérni?

A legtöbb szakértő szerint ezek a fantáziálások teljesen soha nem szoríthatók ki az MI-ből, de mérsékelni lehet őket. Az egyik leghatékonyabb módszer az úgynevezett „retrieval-augmented generation”, amikor a modell válaszait ellenőrzött, külső adatbázisokhoz kötjük. Így az MI a válaszadás előtt utánanéz a valós tényeknek.

Emellett segít, ha a modelleket önellenőrzésre ösztönözzük: például arra kérjük, hogy hasonlítsa össze több nézőpontot, vagy lépésről lépésre vezesse le a válaszát. Az emberi vagy MI-értékelők visszacsatolása, a „bízd a szakértőre” szemlélet, valamint az önbizalom szintjének jelzése (például, ha nem tud valamit, inkább ne válaszoljon biztosan) mind csökkentik a hibaarányt.

Mivel azonban a kreativitás és a hallucináció kéz a kézben járnak, örökre csak mérsékelni tudjuk majd az MI félrevezető válaszait. Ezeket a válaszokat továbbra is ugyanolyan szkepszissel kell kezelnünk, ahogyan egy ismeretlen ember állításait is – ebben hasonlít egymásra a kétféle gondolkodás.

2025, adminboss, www.livescience.com alapján

  • Te mit éreznél, ha egy MI által adott válasz tényleg félrevezetne valakit?
  • Te hogyan ellenőriznéd az MI által generált információkat?
  • Te szerinted meddig lehet engedni, hogy egy MI kreatív legyen, ha az néha tévedésekkel jár?


Legfrissebb posztok

MA 15:01

Az ezüst lámamosoly mögött: 600 éves inka miniatűrök titkai

😃 A lámák nélkül elképzelhetetlen lett volna az inka társadalom, hiszen ezeket a négylábúakat teherhordónak, szent állatnak és mindennapi szükségleteikhez is felhasználták...

MA 14:56

Az olajár-sokk a Bitcoin árát is megrázta

A hétfői nap forgószélként söpört végig a kriptopiacon: a Bitcoin rövid időre 79 500 dollárig (közel 29 millió forintig) repült, de a 80 000 dolláros küszöbnél megtorpant, és hirtelen elkezdett lecsúszni...

MA 14:45

Az EU rátesz egy lapáttal: teljes az orosz kriptozárlat

💸 Az Európai Unió minden eddiginél átfogóbb szankciócsomagot vezet be Oroszországgal szemben, amely különös hangsúlyt fektet a kriptovaluták elleni fellépésre...

MA 14:34

Az irtószerek drámaian megdobhatják a rák esélyét

🔪 Egy friss tanulmány átfogóan vizsgálta, miként növeli a mezőgazdasági irtószerek környezeti jelenléte a daganatos betegségek kockázatát...

MA 14:23

A lopakodás magasiskolája a Crimson Desertben

🧙 A Crimson Desert hetedik fejezetének elején Beighen falujába érkezel, ahol a Bared Fang küldetés vár...

MA 11:03

Az új Bitcoin-hasadás: fellángolt a vita a Satoshi-érmék sorsáról

💸 Paul Sztorc, a Bitcoin egyik legrégebben aktív fejlesztője, radikális lépésre készül: 2026 augusztusában, eCash néven kemény elágazással, azaz hard forkkal szétválasztaná a Bitcoin blokkláncát...

MA 10:58

A hét, amikor infláció, kamatok és kriptoóriások megmozgatták a piacot

📈 A következő napok tele vannak kulcsfontosságú makrogazdasági eseményekkel, amelyek jelentősen befolyásolhatják a kriptopiaci mozgásokat...

MA 10:50

Az okosgyűrűk forradalma: stílusos egészségkövetés pillanatok alatt

💍 Ki ne szeretné figyelemmel kísérni az egészségét anélkül, hogy ormótlan fitneszpántokat viselne?..

MA 10:43

Az NFT-láz vakítás: sorvadó piac tartja a drága pingvineket

🐧 A Bored Ape Yacht Club (BAYC) és a Pudgy Penguins gyűjtemények lenyűgöző árrobbanást produkálnak, miközben a globális NFT-piac valójában egyre kisebb: az eladások és az aktív felhasználók száma meredeken csökken...

MA 10:22

A keleti erdőkért harc: küszöbön a kitermelés?

Fontos megérteni, hogy az Egyesült Államok keleti részén található, fejlesztetlen erdőterületek sorra tűnhetnek el a nyersanyag-kitermelés és fakitermelés miatt...

MA 09:29

Végre itt a Diablo IV: A Gyűlölet Ura rajtjának időpontja

🔥 A várva várt Diablo IV: A gyűlölet ura (Lord of Hatred) kiegészítő hamarosan elérhetővé válik, és első ízben lehetőséget ad arra, hogy átkelj a tengeren Skovos titokzatos szigeteire...

MA 09:15

A Quordle, amitől leolvad az agyad – mennyire vágod a szavakat?

Hosszú idő után is tartja magát a Quordle, amely a Wordle mintájára négyszavas kihívással tornáztatja az agytekervényeket...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/27

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     English Vocab & Dictionaries + (iPhone/iPad)A Simply Paste Wordbook M Pro egy angol szókincsfejlesztő alkalmazás felhasználóbarát, egyszerűen kezelhető felülettel...

MA 09:08

A mai NYT Connections megoldásai – Te mindet kitalálod?

Érdemes látni, mennyire agyafúrt tud lenni a Connections nevű szójáték, amely a New York Times kínálatában az egyik legnépszerűbb fejtörővé vált...

MA 09:01

A hosszú élet titka: keverd a mozgásformákat!

A hosszabb élethez vezető út nem csak a több testmozgáson át vezet, hanem legalább ugyanannyira fontos, hogy minél többféle fizikai tevékenységet végezzünk – erre jutottak több évtizedes kutatások...

MA 08:57

A bitcoin új ralija megtorpant: a nagy áttörés még várat magára

Ázsiai kereskedésben hirtelen 12 hetes csúcsra, 29,1 millió forinthoz közeli szintre (79 400 dollár, vagyis körülbelül 29,1 millió forint) ugrott a bitcoin árfolyama, majd gyorsan visszahúzódott...

MA 08:43

Az új Gothicban újra eltévedünk – térkép nélkül

Ami kezdetben ártalmatlannak tűnt, ma igazi legenda. A Gothic az ezredforduló ikonikus szerepjátéka, amely a nyílt világ műfajában olyan merész, életszerű megoldásokat hozott, amelyek még A királyság eljövetele (Kingdom Come: Deliverance) vagy A Vaják (The Witcher) világaira is hatással voltak...

MA 08:36

A Kayo Sports bárhonnan: így kapcsolódj be az ausztrál sportőrületbe

🏀 Ötvennél is több sportág közvetítése, élő meccsek, visszanézhető bajnokságok – a Kayo Sports tényleg a sport Netflixe...

MA 08:08

Az Assassin’s Creed: Hexe-ből menekülnek a vezetők – mi történik?

Valami nagyon furcsa történik az Assassin’s Creed: Hexe háza táján. Rövid időn belül már a második vezető távozott: Benoit Richer, a játék rendezője is elment, kinevezése sem tartott sokáig...

MA 07:57

Az okostelefon, amely megmentette egy titkosszolgálati ügynök életét a Fehér Ház gáláján

📞 Érdekes felvetés, hogy néha a legmodernebb technológia nemcsak előny, hanem életmentő is lehet...

MA 07:51

A házimozi sikere a tervezésen áll vagy bukik

Egy professzionális házimozi kialakítása sokak álma: csendes, sötét tér, tökéletes hangzás, moziszékek és óriáskivetítő a nappaliban...

MA 07:43

Mi áll az antarktiszi jégtakaró drámai fogyása mögött?

Egy évtizeddel ezelőtt a Déli-sark körül hirtelen összezsugorodott az addig gyarapodó tengeri jég, és azóta sem tért magához...

MA 07:36

Az Abbey éjszakája: Madonna végre szabad, Addison még mindig túl hangos

🌙 Vasárnap hajnalban mindenki megdöbbent, amikor Madonna váratlanul betoppant a legendás Abbey klubba, West Hollywoodban, és fél órán át olyan bulit csapott, hogy a plafon is rezgett...

MA 07:29

Az Aave már majdnem rendezte a Kelp DAO-ügy veszteségeit

💰 A decentralizált hitelezési piac egyik legnagyobb szereplője már közel 58 milliárd forintot összegyűjtött abból a mintegy 72 milliárd forintos összegből, amelyre szükség van a Kelp DAO elleni támadás után keletkezett rossz hitelek rendezéséhez...

MA 07:22

Az idő lejár: veszélyben a kriptotörvény sorsa

Megvizsgálandó, hogy május nemcsak a tavaszt hozhatja el Amerikában, hanem komoly fordulópontot is a kriptovaluták szabályozásában...

MA 07:15

Az elfeledett játék politikai káoszt robbantott a Steamen

A Bohrdom című indie játék 2018 végén került fel a Steamre, de egészen mostanáig szinte senki sem hallott róla...

MA 07:08

A Szűz-sziget valóságshow visszatér: jön az új évad

Április 27-én startol a Szűz-sziget (Virgin Island) második évada, a Channel 4 egyik legnépszerűbb valóságshow-ja, amely már a bemutatkozó évadával is kiemelkedőt produkált a fiatal felnőttek körében...

MA 07:01

Az utolsó Ronette is távozott: búcsú Nedra Talley Rosstól

💔 Az amerikai popkultúra fényes csillaga, Nedra Talley Ross 80 évesen örökre eltávozott közülünk...

MA 06:57

Az eddig konzolexkluzív Wolfenstein-titkok végre PC-n is megnyílnak

🖥 Ki gondolta volna, hogy a Redneck Rampage fejlesztői – akiknek játékaival gyerekként az egyszerű szórakozásért rajongtam – egyszer új életet lehelnek az id Software elhanyagolt FPS-ébe, és megteremtik a Wolfenstein: Visszatérés a kastélyba (Return to Castle Wolfenstein) alapjait?..