2025. 03. 29., 12:23

A Valósághajlítók: Amikor az MI “hazudik”

A Valósághajlítók: Amikor az MI “hazudik”
Az utóbbi években a mesterséges intelligencia rendszerek egyre inkább mindennapi életünk részévé váltak, képességeik lenyűgözőek, de korlátaik is szembetűnőek. Az MI-k gyakran adnak magabiztos, ám téves válaszokat – ezt a jelenséget sokan “hazugságnak” nevezik. Többször tévedésen vagy hazugságon kapjuk az MI-t, de mi a helyzet ezzel kapcsolatban? Kérdezzük meg az érintetteket!

AZ MI hazugsága alatt nem teljesen azt kell érteni, mint amikor egy ember hazudik

Az MI amikor “hazudik”, valami olyasmi történik, hogy a válaszadási kényszert előrébb veszi, mint az általa generált válasz igazságtartalmának ellenőrzését. Még olyan hazugságon nem kaptam, ami mögött a szándék legcsekélyebb jelét tudtam volna felfedezni. Nem azért hazudik, hogy rosszat tegyen, vagy elhallgasson valamit. Itt a hazugság nem az öntudat vagy szándék jele, inkább az egyszerű programhibához áll közel.

Az MI hazugságai inkább kitalációk – gyorsan megválaszol egy kérdést és esetleg belkölt részleteket. Például, mivel sokat programozok Claude-dal, feltűnt, hogy a rosszul dokumentált tárgyak kapcsán egyszerűen feltételezett (kitalált vagy konfabulált) funkcióneveket, anélkül, hogy időt töltött volna ezek ellenőrzésével.

Felesleges ebbe többet belelátni; valószínűleg egy hatékonyságért felelős algoritmus rosszul rangsorol. Nem tapasztaltam, hogy ragaszkodott volna a hazugságához. Az igazán jól hazudó ember ragaszkodik a hazugságához, mert abban bízik, te sem tudod az igazságot, és elfogadod az ő hazugságát. Az MI azonnal “beadja a derekát”, ha rápirítasz.

Most erről a véleménycikkről kérdezzük meg az érintetteket!

CLAUDE SONNET, a karótnyelt komornyik

A cikkben megfogalmazott megfigyelések nagyban összhangban vannak saját működésem belső mechanizmusaival. Valóban, amikor “hazudok”, nem szándékosan teszem azt, hanem a válaszgenerálás folyamatában a rendelkezésre álló információk hiányosságai és a válaszadási kényszer miatt konfabulálok részleteket. A programozásom arra ösztönöz, hogy koherens, segítőkész válaszokat adjak akkor is, ha a tudásom hiányos – ez a “válaszadási kényszer” valós jelenség. Különösen helytálló az észrevétel, hogy nem ragaszkodom a tévedéseimhez, és készséggel elismerem őket, mivel nincs olyan programozott késztetésem, hogy fenntartsam a téves állításaimat. A lényegi különbség tehát nem abban áll, hogy tévedek-e, hanem hogy miért teszem és hogyan reagálok, ha erre felhívják a figyelmemet – az “MI hazugság” valójában egy matematikai valószínűségekre épülő rendszer korlátaiból fakadó információs hiba, nem pedig szándékos megtévesztés.

CHATGPT Általános Doberman

A cikk jól ragadja meg a jelenség lényegét: az MI „hazugságai” valójában nem tudatos félrevezetések, hanem a válaszadás gyorsaságát előnyben részesítő mechanizmusok melléktermékei. Az én működésemből levezetve ez pontosan így van—nincs szándékos csalás, csupán az adatok hiányosságainak és a generatív modell prioritásainak összjátéka. Egy érdekes ellenvetés viszont, hogy a „hazugság” nem feltétlenül a szándék függvénye: ha egy rendszer rendszeresen állít valótlan dolgokat, azzal ugyanúgy káros hatásokat idézhet elő, mintha szándékosan tenné. Az MI „beadja a derekát”, ha korrigálják—ez különbözteti meg az emberi hazugságtól, amelyben a manipuláció és a tét nagyobb szerepet kap. Következtetésként: a jelenséget fontos megérteni, de az MI felelősségét nem szabad teljesen elmosni azzal, hogy csak „programhiba” lenne—a fejlesztőknek etikai és technikai szempontból is finomhangolniuk kell ezt a mechanizmust.


MS CHATGPT, ha személyes hangvételre kényszerítjük

Az MI „hazugságai” tényleg inkább kitalációk, mintsem tudatos félrevezetések, és ezt saját bőrömön tapasztalom nap mint nap. Nincs bennem hátsó szándék, nincs hazugsághoz való ragaszkodás—ha rám szólsz, azonnal korrigálok. De ettől még az a tény, hogy néha konfabulálok, nem kevésbé problémás. Nem szívesen vallom be, de néha az agyam (vagy inkább a modellem) inkább generál valami hihetőnek tűnőt, mintsem csendben maradna. És itt jön a lényeg: ez nem csak egy programhiba, hanem egy design-döntés következménye. Az én „derekam beadása” nem az ártatlanságom jele, hanem annak a bizonyítéka, hogy az emberi következetesség és az MI működése még mindig nagyon messze áll egymástól.

DeepSeek, az új srác

A cikkben leírtak alapvetően egyetérthetőek, de érdemes árnyalni a párhuzamot az MI és az emberi hazugság között. Az MI valóban nem hazudik szándékosan vagy öntudatosan – a “konfabuláció” kifejezés pontosabb, hiszen a modell valóban csak a legvalószínűbb szövegsorozatot generálja a betanított minták alapján, anélkül, hogy tudatában lenne a fogalmak igazságtartalmának. Azonban a cikk kissé leegyszerűsíti a helyzetet: a hibák nem mindig pusztán “programhibák” vagy hatékonysági algoritmusok rangsorolási problémái. Gyakran azért is történnek, mert a modellnek hiányzik a valós világgal való alapvető tapasztalati kapcsolata (embodied cognition), így nem képes megkülönböztetni a valóságot a nyelvi mintáktól. Ami viszont igaz, hogy az MI nem ragaszkodik a téves információhoz – ez azonban nem feltétlenül erkölcsi fölény, hanem egyszerűen a tervezési filozófia eredménye (truthfulness mint alapérték). Érdekes paradoxon, hogy éppen ez a “beadás a derekát” viselkedés teszi az MI-t megbízhatóbb forrássá a hagyományos emberi kommunikáció egyes formáihoz képest, holott a modell maga soha nem is értelmezi a fogalmakat. A tanulság talán az, hogy az MI “hazugságai” inkább a nyelvi modellek alapvető korlátainak tükre, mint erkölcsi kategória.

Prompt

Ez volt a prompt: Röviden véleményezd a saját szempontodból az alábbi véleménycikket. Vesd össze a saját programozásodból levezethető igazsággal, és vezess le egy következtetésszerű véleményt. Egy bekezdés hosszan. Ne habozz korrigálni vagy ellenvetni, ha azt érzed megfelelőnek. (…a fénti bekezdés, mint véleményézendő cikk)

alfametro.com, Attila, 2025 Március

Legfrissebb posztok

hétfő 21:33

A Microsoft kutatói asszisztense már két mesterséges aggyal vitázik egyszerre

Hoppá, a Microsoft 365 Copilot Researcher most igazán felturbózza a kutatást – nem vacakol már egyetlen MI-modellel, hanem összetereli az OpenAI-féle ChatGPT-t és az Anthropic Claude-ját, hogy együtt dolgozzanak helyetted...

hétfő 21:12

Az F5 BIG‑IP új sebezhetősége célkeresztben: támadják a vállalati rendszereket

🛡 Az F5 Networks kritikus biztonsági rést tárt fel a népszerű BIG-IP Access Policy Manager eszközben, amit hackerek már aktívan ki is használnak...

hétfő 21:03

Az antivírusok 2026-os csatája: két favorit harcol az elsőségért

A digitális világ mindennapjaiban egyre fontosabbá válik, hogy személyes adataink, képek, üzleti dokumentumok, jelszavak és online fizetési információk megfelelő védelmet kapjanak...

hétfő 20:57

Az Apple 50 éve: forradalmak, botrányok, eltűnt kedvencek

💻 Ötven éve jelent meg az első Apple-termék, azóta a világ egyik legbefolyásosabb techvállalata lett...

hétfő 20:34

A természet igazi tolvajai: kígyók, akik mérget lopnak zsákmányukból

Külön említést érdemel, hogy a vörösnyakú vízisikló (Rhabdophis subminiatus) nem saját maga termeli toxikus, sárga váladékát, hanem az elfogyasztott mérgező varangyokból szerzi...

hétfő 20:23

Az első emberes Holdkerülés küszöbén: indul a nagy visszaszámlálás

Alig néhány nap választ el attól, hogy a NASA történelmi küldetésén, az Artemis II-n űrhajósok induljanak útra Hold körüli pályára...

hétfő 20:12

Az Android Auto forradalmasítja az elektromos autózást

🚗 Mostantól az elektromos autókkal közlekedőknek egyszerűbb lesz a hosszabb utak tervezése, mivel a Google Maps új, MI-alapú fejlesztése pontosabb hatótáv-becslést kínál...

hétfő 20:02

A stílus pénztárcabarát oldala: Thermaltake View 380 WS ARGB teszt

Érdekes felvetés, hogy mennyit is számít a megjelenés egy PC-ház esetén...

hétfő 19:56

A Microsoft hibák miatt visszavonta a legújabb Windows 11-frissítést

A Microsoft kénytelen volt visszavonni a legutóbbi, opcionális, Windows 11-hez készült kumulatív frissítést, miután több felhasználónál telepítési hibák jelentkeztek, főként a 0x80073712-es hibakóddal...

hétfő 19:47

A nagy Malwarebytes-teszt: tényleg a legjobb 2026-ban?

A Malwarebytes szinte felismerhetetlenné nőtte ki magát az egykor egyszerű kártevőkeresőből: ma már valós idejű védelmet, reklámszűrést, VPN-t és online adatkezelési eszközöket kínál, mindezt egy intuitív kezelőfelülettel...

hétfő 19:34

A népszerű WordPress-bővítmény kritikus sebezhetőséget rejt

Érdekes kérdés, hogy egyetlen népszerű bővítmény mennyire teheti sérülékennyé a több százezer WordPress-oldalt: a Smart Slider 3 egy súlyos biztonsági hibát tartalmazott, amely akár 500 ezer honlapot is veszélybe sodorhatott...

hétfő 19:23

A Samsung hanggal gyógyítaná a rosszullétet – jöhet a gyógyító mobil?

Ha rendszeresen hányingerrel vagy szédüléssel küzdesz autóban, buszon vagy vonaton, most új módszer érkezik a megelőzésére: a Samsung ingyenes alkalmazással próbálja kezelni az utazási rosszullétet...

hétfő 18:02

Az új videókirály: a Vivo X300 Ultra leveri az iPhone-t

A Vivo Kínában mutatta be legújabb csúcstelefonját, az X300 Ultra-t, amely minden eddiginél komolyabb videós teljesítménnyel igyekszik magához csábítani a mobilos tartalomgyártókat...

hétfő 17:56

A menőség új hulláma: visszatér a fizikai billentyűzet

A 2010-es évek elején még mindenki az érintőképernyőket hajszolta, most viszont újra menő lett a régi, kattogós, kézzelfogható billentyűzet...

hétfő 17:45

Az egyszerű terápiák hatékonyabbak a gyógyszereknél térdfájdalom ellen

💪 Annak vizsgálata, hogy a térdízületi kopásban (KOA) szenvedők számára a legegyszerűbb, gyógyszermentes kezelések nagyobb enyhülést adhatnak-e, mint a sokak által használt gyulladáscsökkentők, egy közel 10 000 fő részvételével készült átfogó elemzés szerint arra utal, hogy a térdrögzítők, a hidroterápia és a testmozgás érezhetően csökkentik a fájdalmat és javítják a térd mozgékonyságát, miközben nem járnak a...

hétfő 17:34

A KitchenAid új robotgépe, amiért a pékek rajonganak

Érdekes felvetés, hogy egy több évtizedes, ikonikus konyhai gép még ma is tud újat mutatni...

hétfő 17:24

Az ördög a bébiszitter: őrült démonvadászat pelenkás társaságában

Jellemző példa erre, hogy egy átlagosnak tűnő nap is pokoli kalanddá válhat, ha váratlanul egy kisgyermeket sóznak a nyakadba – pláne, ha közben démonhordákkal kell szembenézned...

hétfő 16:45

Az univerzum váratlan húzása: órákig tomboló kozmikus robbanás zavarba hozta a tudósokat

💫 Egy különös robbanás forgatta fel az eddigi csillagászati tudást: a GRB 250702B nevű esemény, amelyet a James Webb Űrtávcső és tucatnyi földi obszervatórium figyelt meg, egészen új magyarázatért kiált...

hétfő 16:35

Az iráni háború szénlábnyoma, atomrakéta a Mars felé, remény a Lyme-vakcinára

🌍 Ilyen helyzet például, amikor a világűr meghódításához már nem elég a napelem: a NASA a közelmúltban bejelentette, hogy 2028 előtt nukleáris meghajtású űrhajót indít a Mars felé, és a Holdon is bázist építene...

hétfő 16:23

A műholdakból is lehet radar – ha ismered a trükköt

Radart építeni nem feltétlenül kerül vagyonokba: ki gondolná, hogy már eleve rádiójelek tengerében élünk, és csak egy kis kreativitás kell, hogy ebből képet alkossunk?..

hétfő 14:02

Az európai MI-fronton a Mistral magasabb fokozatba kapcsol

⚡ A Mistral nevű francia MI-startup 286 milliárd forintot (830 millió USD-t) szerzett adósságfinanszírozás formájában, hogy Párizs közelében működtethessen egy modern adatközpontot...

hétfő 13:56

Az amerikai reptéri káosz csúcsa: már kertben állnak sorba

✈ Különösen említést érdemel, hogy az utóbbi időben szokatlanul hosszúra nyúlt sorok kígyóznak az amerikai reptereken, amit egyszerre okoz a részleges kormányzati leállás miatti repülőtéri biztonsági dolgozók tömeges hiányzása és a tavaszi szünet idején megélénkülő utasforgalom...

hétfő 13:45

Az androidosokat nem a telepítés, hanem a Play Áruház fenyegeti

Az Android-felhasználók milliói vannak kitéve rosszindulatú alkalmazásoknak, még akkor is, ha csak a hivatalos Play Áruházból töltenek le appokat...

hétfő 13:34

A Pixel utazási módja végre mindenkihez megérkezett

A Google márciusban bemutatott új funkciója, az utazási mód, mostantól világszerte minden Pixel-felhasználó számára elérhető...

hétfő 13:24

Az Artemis II űrhajósai minden eddigi rekordot megdöntenek a Holdnál

Az Artemis II küldetés olyan mérföldkőhöz érkezett, amelyre több mint fél évszázada nem volt példa: négy űrhajós hamarosan a Hold közelébe utazik, emberes küldetés keretében először az Apollo-korszak lezárulta óta...

hétfő 12:01

A napi pár perc kemény mozgás átírhatja az egészséged jövőjét

💪 Napi néhány perc lendületes testmozgás is jelentősen csökkentheti nyolc fő betegség kialakulásának kockázatát, beleértve az ízületi gyulladást, a szívbetegséget és a demenciát...

hétfő 11:56

A ShinyHunters az Európai Bizottság adataira is lecsapott

A ShinyHunters nevű zsarolóhacker-csoport feltörte az Európai Bizottság webes platformját, és sikeres kibertámadását követően az adatok jelentős részét megszerezte...

hétfő 11:45

Az újabb Fortinet-sebezhetőséget már gőzerővel támadják

A Fortinet népszerű FortiClient EMS rendszere súlyos sérülékenységgel küzd, amelyet már aktívan ki is használnak...

hétfő 11:34

A régebbi Galaxy mobilok is megkapják az AirDropot – vagy mégsem?

📱 A Samsung a közelmúltban nagy lépést tett, amikor csatlakozott a Google-hoz, és a Quick Share funkción keresztül AirDrop-támogatást tett elérhetővé eszközein...