2025. 06. 22., 17:15

Az MI egyre többet képzelődik – és ez baj?

Az MI egyre többet képzelődik – és ez baj?
Az MI fejlődésével egyre gyakrabban fordul elő, hogy hamis vagy hibás információkat közöl. Az OpenAI legújabb, legerősebb modelljei, az o3 és az o4-mini a PersonQA-teszten 33%-ban, illetve 48%-ban hallucináltak – ez több mint kétszerese a korábbi o1 típus hibaarányának. Az új generáció valóban jobb válaszokat tud adni, de ezzel párhuzamosan nőtt a tévedések száma is. Ennek következtében egyre nagyobb kérdés, hogy mennyire bízhatunk meg a nagy nyelvi MI-chatbotokban, alkalmazásokban és az általuk szolgáltatott tartalmakban. Ha egy rendszer ugyanolyan meggyőzően ad elő kitalációkat, hamis tényeket, idézeteket vagy eseményeket, mint a valódi adatokat, könnyen félrevezetheti a felhasználókat. Ez különösen akkor probléma, ha ellenőrzés nélkül hagyatkozunk ezekre az információkra.

Az MI-nek muszáj kreatívnak lennie

A fejlett MI-modellek lényege, hogy bonyolult feladatokat is képesek megoldani: szétbontják azokat kisebb részekre, majd ezekre kidolgoznak megoldásokat. Nem csupán valószínűségi alapon megtanult válaszokat adnak vissza, hanem saját stratégiákat dolgoznak ki, hasonlóan az emberi gondolkodáshoz.

Egy igazán kreatív, új ötlet vagy megoldás azonban elképzeli, vagyis lényegében „hallucinálja” is a válaszokat – e nélkül az MI csak a betanult adatbázis szigorú határain belül mozogna. Egy MI-kutató úgy fogalmazza meg: minden egyes LLM által generált válasz hallucináció, a különbség csupán annyi, hogy némelyik eltalálja a valóságot.

Ha csak azt tudná visszaadni, ami már volt, soha nem írna például dalszöveget egy olyan konceptalbumhoz, amely az MI-szingularitásról szól Snoop Dogg és Bob Dylan stílusában. Az imagináció, az ötletelés „emberi módja” így alapfeltétele az MI kreativitásának is.

Amikor már nem elég jó a fantázia

A gond akkor kezdődik, amikor a kitalált, téves információkat is ugyanolyan magabiztosan közli az MI, mint a valós adatokat, és a felhasználók ezt ellenőrzés nélkül elfogadják. Ez főleg olyan területeken életveszélyes, ahol a pontosság kulcsfontosságú, például az orvostudományban, a jogban vagy a pénzügyekben. Ezeknél a modelleknél nemcsak kevésbé nyilvánvaló hibákkal, hanem sokkal rafináltabb, nehezebben felismerhető tévedésekkel is találkozunk. Az MI egyre inkább beépíti a hibás információkat logikusnak tűnő érvelésekbe és történetekbe, így azok szinte „észrevétlenül” válnak meggyőzővé.

Ráadásul egyelőre azt sem tudjuk pontosan, hogyan születnek ezek a válaszok a modellekben – az MI működése továbbra is rejtély, akárcsak az emberi agy logikája. Például, amikor egy MI pénzügyi dokumentumot foglal össze, valójában fogalmunk sincs, miért dönt egyik vagy másik szó vagy információ mellett – vagy hogy miért hibázik.

Nem csoda, hogy a cégek ügyfélszolgálati chatbotjai rendszeresen találnak ki sosem létezett szabályzatokat, vagy hivatkoznak fiktív forrásokra.

Lehet egyáltalán kevesebb „álomvilágot” elérni?

A legtöbb szakértő szerint ezek a fantáziálások teljesen soha nem szoríthatók ki az MI-ből, de mérsékelni lehet őket. Az egyik leghatékonyabb módszer az úgynevezett „retrieval-augmented generation”, amikor a modell válaszait ellenőrzött, külső adatbázisokhoz kötjük. Így az MI a válaszadás előtt utánanéz a valós tényeknek.

Emellett segít, ha a modelleket önellenőrzésre ösztönözzük: például arra kérjük, hogy hasonlítsa össze több nézőpontot, vagy lépésről lépésre vezesse le a válaszát. Az emberi vagy MI-értékelők visszacsatolása, a „bízd a szakértőre” szemlélet, valamint az önbizalom szintjének jelzése (például, ha nem tud valamit, inkább ne válaszoljon biztosan) mind csökkentik a hibaarányt.

Mivel azonban a kreativitás és a hallucináció kéz a kézben járnak, örökre csak mérsékelni tudjuk majd az MI félrevezető válaszait. Ezeket a válaszokat továbbra is ugyanolyan szkepszissel kell kezelnünk, ahogyan egy ismeretlen ember állításait is – ebben hasonlít egymásra a kétféle gondolkodás.

2025, adminboss, www.livescience.com alapján

  • Te mit éreznél, ha egy MI által adott válasz tényleg félrevezetne valakit?
  • Te hogyan ellenőriznéd az MI által generált információkat?
  • Te szerinted meddig lehet engedni, hogy egy MI kreatív legyen, ha az néha tévedésekkel jár?


Legfrissebb posztok

kedd 18:04

Az idei legjobb csillagvetítők: csillagos ég a gyerekszobában

⭐ A csillagvetítők ma már nemcsak díszes éjszakai fények: a komolyabb modellek igazi tudományos taneszközökké váltak, amelyekkel csillagképeket, bolygókat és a világegyetem izgalmait lehet közelebb hozni a gyerekekhez...

kedd 17:59

Az MI-botrány nyomában: Discord, kiszivárgott adatok és a Thiel-szál

🔎 A Discord, az egyik legnépszerűbb kommunikációs platform, komoly adatvédelmi botránnyal szembesült, miután kiderült, hogy a Persona Identities nevű azonosítószoftverének kódja nyilvánosan elérhető volt az interneten, sőt amerikai kormányzati szervereken is hozzáférhetővé vált...

kedd 17:39

Az írás születésének titkai: rejtett nyomok az őskori művészetben

Meglepő nyomokra bukkantak a németországi barlangokban előkerült, mintegy 40 ezer éves műtárgyakon: az őskori mesterek nem pusztán kedvtelésből véstek vonalakat, pöttyöket és kereszteket az elefántcsontfigurákra; ezek a díszítések egy jól szervezett, jelentéssel bíró rendszer részei lehettek...

kedd 17:20

Az északkeleti hóvihar: mesebeli hóemberek, pokoli lapátolás

❄ Az Egyesült Államok északkeleti részén közel 38 cm hó esett, megbénítva New York City-t, New Jersey-t, Connecticutot, Rhode Islandet és Massachusettset...

kedd 17:02

Az amerikai részvények már éjjel-nappal kereskedhetők a Krakenen

📈 A Kraken kriptotőzsde új szintre emeli a kereskedést: mostantól már tokenizált amerikai részvényekkel is lehet folyamatosan, a nap 24 órájában, akár húszszoros tőkeáttéttel kereskedni...

kedd 17:00

Az MI átrajzolja a hatalmi térképet – Ki marad talpon?

🗺 Az elmúlt évben minden korábbinál nagyobb volt a vezetői pozíciók cseréje a nagyvállalatoknál, de ennek oka nem valamilyen piaci visszaesés vagy rossz negyedév volt...

kedd 16:39

Az észak-koreai Lazarus-csoport már kórházakra is rászállt

Amerikai egészségügyi szervezetek kerültek célkeresztbe: a Lazarus néven ismert, államilag támogatott észak-koreai hackercsoport a Medusa nevű zsarolóvírust vetette be ellenük...

kedd 16:21

Az MI-háború új fejezete: visszavágtak a kínai techóriások az Anthropicnak?

🚀 Egyre élesedik a nemzetközi mesterségesintelligencia-verseny, most három ismert kínai cég került a reflektorfénybe: a DeepSeek, a Moonshot AI és a MiniMax...

kedd 14:01

Az Autopilot-botrány: a Tesla hadat üzen a kaliforniai hatóságoknak

A Tesla beperelte a kaliforniai Közlekedési Hatóságot (DMV), miután az megtiltotta az Autopilot és a Full Self-Driving elnevezések használatát az autók értékesítésekor...

kedd 13:59

A mikroműanyagok rejtélye: ártanak nekünk, vagy túlzás a félelem?

🤔 Érdemes megvizsgálni, mennyire megalapozottak a mikroműanyagok egészségkárosító hatásairól szóló figyelmeztetések. Az elmúlt években félelmet keltő hírek terjedtek el: mikroműanyagok már mindenütt jelen vannak, az élelmiszerektől a vízen át a tisztítószerekig, és lassan felhalmozódnak a szervezetünkben – legalábbis ezt állították...

kedd 13:40

Az MI leleplezi a nyílt forráskódú világ 500+ sebezhetőségét

A szoftvervilágban most olyan történések zajlanak, amelyek alapjaiban rengetik meg azt, amit eddig a biztonságról gondoltunk...

kedd 13:20

A Pentagon titkos hálózatain bukkant fel Elon Musk MI-je

🕵 Az amerikai védelmi minisztérium hamarosan hadrendbe állítja Elon Musk tulajdonában lévő Grok nevű MI-t, amelyet titkos katonai rendszerekben is bevethetnek...

kedd 12:01

Az OpenClaw MI-ügynöke kis híján lenullázta a teljes postaládát

📥 A Meta egyik MI-biztonsági kutatója, Summer Yue szerint kis híján komoly adatvesztésbe torkollott egy kísérlete az OpenClaw ügynökkel...

kedd 11:39

Az új GL.iNet Flint 3: Wi‑Fi 7, sci-fibe csomagolva

🚀 A GL.iNet Flint 3 BE9300 router igazi erőmű a Wi‑Fi 7-es szabvány terén, és első látásra akár egy sci-fi regényből is érkezhetett volna...

kedd 11:21

Az MI felforgat mindent: hová tűnt a befektetők hűsége?

Az MI-őrület mostanra teljesen felforgatta a kockázatitőke-piac jól bevált szabályait. A közelmúltban az OpenAI hatalmas tőkebevonásának árnyékában az Anthropic is soha nem látott, 10 800 milliárd forint értékű befektetést szerzett...

kedd 11:02

Az új Dyson PencilWash tarol: ultravékony és szuperkönnyű

A Dyson most mutatta be legújabb padlótisztító találmányát, amely szinte forradalmasítja a takarítást az otthonokban...

kedd 10:56

A jövő páncélszekrénye: üvegmemória, amely túléli az évszázadokat

Az emberiség egyre több adatot termel és gyűjt, minden eddiginél gyorsabb ütemben – a mesterséges intelligencia elterjedésével pedig a tárolandó információ mennyisége robbanásszerűen nő...

kedd 10:46

Itt a várva várt élő helymegosztás a Google Messages-ben

Az elmúlt években a Google Messages egy egyszerű üzenetküldő alkalmazásból fejlett, modern platformmá nőtte ki magát Androidon...

kedd 10:37

Az MI‑pánik újra padlóra küldi a kriptoárfolyamokat

Az utóbbi hét napban a főbb kriptodevizák látványos, 8–11%-os veszteségeket szenvedtek el...

kedd 10:19

A baktériumok belülről falják fel a daganatokat

💉 Különleges génmódosítással készült baktériumok hamarosan képesek lehetnek arra, hogy felfalják a rákos daganatokat belülről kifelé...

kedd 10:02

Az MI-ügynökök vadnyugatának vége: a Google tiltólistára teszi az OpenClaw-t

🕵 A hétvégén kitört a botrány a Google körül, miután számos fejlesztő hozzáférését korlátozták a népszerű Antigravity-platformhoz...

kedd 09:56

Az ember visszatér a Holdra, az egér az új szupervakcinára tüsszent

2026. február 23. Az elmúlt hét bővelkedett a meglepetésekben: váratlan fordulat a Moderna új mRNS-influenza-vakcinája engedélyezése körül, biztató kísérleti eredmények egy univerzális, belélegezhető oltásról, veszélyesnek bizonyuló légszennyezés és egy sivatagi dinólelelet, ami átírja a spinosauridák történetét...

kedd 09:46

Az MI energiaéhsége: Sam Altman mindent bevetne, hogy ne legyen igazuk

Sam Altman, az OpenAI vezérigazgatója újabb hullámokat keltett azzal, hogy minden MI-t támadó hangot visszautasított az India AI Impact csúcstalálkozón, mondván, igazán elfogadhatatlan az a „csúnya” vád, hogy sok vizet és energiát zabál az MI – hiszen tessék, az emberek is 20 évig csak esznek, nőnek és tanulnak, mire okossá válnak...

kedd 09:37

Az indiai Xflow felforgatja a nemzetközi vállalati pénzáramlást

🌍 Az Xflow egy indiai fintech startup, amely jelentős támogatást kapott a Stripe-tól és a PayPal Ventures-től, miután 6 milliárd forintnyi (16,6 millió USD) tőkét vont be...

kedd 09:28

Az Atlanti-óceán ősi erői feltártak egy hatalmas föld alatti kanyont

Mintegy 1000 kilométerre Portugália partjaitól, mélyen az Atlanti-óceán alatt, egy hatalmas föld alatti kanyonrendszer húzódik, amely minden szárazföldi képződményt felülmúl – köztük a Nagy-kanyont (Grand Canyon) is...

kedd 09:20

Az agy rejtélyes átalakulása menopauzában: amit még nem értünk

🧠 A menopauza komoly változást hoz a nők életében, és gyakran nem csupán testi tüneteket okoz...

kedd 09:10

A nagy hóháború: kinek a dolga a lapátolás?

❄ Kezdetben egy hóvihar igazi próbája annak, mennyire működik a társadalmi szerződés...

kedd 09:01

A Fairphone végre felzárkózik: jön az Android 16

Na jó, szóval végre érkezik az Android 16 a Fairphone Gen 6-ra – és ha már a nagy riválisoknál ez megoldódott, igazán ideje volt, nem?..

kedd 08:46

A spanyol hatóságok lecsaptak: hacktivisták a kormány elleni DDoS mögött

Négy feltételezett hacktivistát vett őrizetbe a spanyol Polgárőrség, akik a gyanú szerint több kormányzati minisztérium, politikai párt és közintézmény ellen indítottak kibertámadásokat...