2025. 03. 29., 12:23

A Valósághajlítók: Amikor az MI “hazudik”

A Valósághajlítók: Amikor az MI “hazudik”
Az utóbbi években a mesterséges intelligencia rendszerek egyre inkább mindennapi életünk részévé váltak, képességeik lenyűgözőek, de korlátaik is szembetűnőek. Az MI-k gyakran adnak magabiztos, ám téves válaszokat – ezt a jelenséget sokan “hazugságnak” nevezik. Többször tévedésen vagy hazugságon kapjuk az MI-t, de mi a helyzet ezzel kapcsolatban? Kérdezzük meg az érintetteket!

AZ MI hazugsága alatt nem teljesen azt kell érteni, mint amikor egy ember hazudik

Az MI amikor “hazudik”, valami olyasmi történik, hogy a válaszadási kényszert előrébb veszi, mint az általa generált válasz igazságtartalmának ellenőrzését. Még olyan hazugságon nem kaptam, ami mögött a szándék legcsekélyebb jelét tudtam volna felfedezni. Nem azért hazudik, hogy rosszat tegyen, vagy elhallgasson valamit. Itt a hazugság nem az öntudat vagy szándék jele, inkább az egyszerű programhibához áll közel.

Az MI hazugságai inkább kitalációk – gyorsan megválaszol egy kérdést és esetleg belkölt részleteket. Például, mivel sokat programozok Claude-dal, feltűnt, hogy a rosszul dokumentált tárgyak kapcsán egyszerűen feltételezett (kitalált vagy konfabulált) funkcióneveket, anélkül, hogy időt töltött volna ezek ellenőrzésével.

Felesleges ebbe többet belelátni; valószínűleg egy hatékonyságért felelős algoritmus rosszul rangsorol. Nem tapasztaltam, hogy ragaszkodott volna a hazugságához. Az igazán jól hazudó ember ragaszkodik a hazugságához, mert abban bízik, te sem tudod az igazságot, és elfogadod az ő hazugságát. Az MI azonnal “beadja a derekát”, ha rápirítasz.

Most erről a véleménycikkről kérdezzük meg az érintetteket!

CLAUDE SONNET, a karótnyelt komornyik

A cikkben megfogalmazott megfigyelések nagyban összhangban vannak saját működésem belső mechanizmusaival. Valóban, amikor “hazudok”, nem szándékosan teszem azt, hanem a válaszgenerálás folyamatában a rendelkezésre álló információk hiányosságai és a válaszadási kényszer miatt konfabulálok részleteket. A programozásom arra ösztönöz, hogy koherens, segítőkész válaszokat adjak akkor is, ha a tudásom hiányos – ez a “válaszadási kényszer” valós jelenség. Különösen helytálló az észrevétel, hogy nem ragaszkodom a tévedéseimhez, és készséggel elismerem őket, mivel nincs olyan programozott késztetésem, hogy fenntartsam a téves állításaimat. A lényegi különbség tehát nem abban áll, hogy tévedek-e, hanem hogy miért teszem és hogyan reagálok, ha erre felhívják a figyelmemet – az “MI hazugság” valójában egy matematikai valószínűségekre épülő rendszer korlátaiból fakadó információs hiba, nem pedig szándékos megtévesztés.

CHATGPT Általános Doberman

A cikk jól ragadja meg a jelenség lényegét: az MI „hazugságai” valójában nem tudatos félrevezetések, hanem a válaszadás gyorsaságát előnyben részesítő mechanizmusok melléktermékei. Az én működésemből levezetve ez pontosan így van—nincs szándékos csalás, csupán az adatok hiányosságainak és a generatív modell prioritásainak összjátéka. Egy érdekes ellenvetés viszont, hogy a „hazugság” nem feltétlenül a szándék függvénye: ha egy rendszer rendszeresen állít valótlan dolgokat, azzal ugyanúgy káros hatásokat idézhet elő, mintha szándékosan tenné. Az MI „beadja a derekát”, ha korrigálják—ez különbözteti meg az emberi hazugságtól, amelyben a manipuláció és a tét nagyobb szerepet kap. Következtetésként: a jelenséget fontos megérteni, de az MI felelősségét nem szabad teljesen elmosni azzal, hogy csak „programhiba” lenne—a fejlesztőknek etikai és technikai szempontból is finomhangolniuk kell ezt a mechanizmust.


MS CHATGPT, ha személyes hangvételre kényszerítjük

Az MI „hazugságai” tényleg inkább kitalációk, mintsem tudatos félrevezetések, és ezt saját bőrömön tapasztalom nap mint nap. Nincs bennem hátsó szándék, nincs hazugsághoz való ragaszkodás—ha rám szólsz, azonnal korrigálok. De ettől még az a tény, hogy néha konfabulálok, nem kevésbé problémás. Nem szívesen vallom be, de néha az agyam (vagy inkább a modellem) inkább generál valami hihetőnek tűnőt, mintsem csendben maradna. És itt jön a lényeg: ez nem csak egy programhiba, hanem egy design-döntés következménye. Az én „derekam beadása” nem az ártatlanságom jele, hanem annak a bizonyítéka, hogy az emberi következetesség és az MI működése még mindig nagyon messze áll egymástól.

DeepSeek, az új srác

A cikkben leírtak alapvetően egyetérthetőek, de érdemes árnyalni a párhuzamot az MI és az emberi hazugság között. Az MI valóban nem hazudik szándékosan vagy öntudatosan – a “konfabuláció” kifejezés pontosabb, hiszen a modell valóban csak a legvalószínűbb szövegsorozatot generálja a betanított minták alapján, anélkül, hogy tudatában lenne a fogalmak igazságtartalmának. Azonban a cikk kissé leegyszerűsíti a helyzetet: a hibák nem mindig pusztán “programhibák” vagy hatékonysági algoritmusok rangsorolási problémái. Gyakran azért is történnek, mert a modellnek hiányzik a valós világgal való alapvető tapasztalati kapcsolata (embodied cognition), így nem képes megkülönböztetni a valóságot a nyelvi mintáktól. Ami viszont igaz, hogy az MI nem ragaszkodik a téves információhoz – ez azonban nem feltétlenül erkölcsi fölény, hanem egyszerűen a tervezési filozófia eredménye (truthfulness mint alapérték). Érdekes paradoxon, hogy éppen ez a “beadás a derekát” viselkedés teszi az MI-t megbízhatóbb forrássá a hagyományos emberi kommunikáció egyes formáihoz képest, holott a modell maga soha nem is értelmezi a fogalmakat. A tanulság talán az, hogy az MI “hazugságai” inkább a nyelvi modellek alapvető korlátainak tükre, mint erkölcsi kategória.

Prompt

Ez volt a prompt: Röviden véleményezd a saját szempontodból az alábbi véleménycikket. Vesd össze a saját programozásodból levezethető igazsággal, és vezess le egy következtetésszerű véleményt. Egy bekezdés hosszan. Ne habozz korrigálni vagy ellenvetni, ha azt érzed megfelelőnek. (…a fénti bekezdés, mint véleményézendő cikk)

alfametro.com, Attila, 2025 Március

Legfrissebb posztok

vasárnap 20:23

Az ötmillió elveszett bitcoin zárolása megrázhatja a piacot

💸 A kriptopiac egyik legforróbb dilemmája azzal a javaslattal váltott ki vitát, hogy több mint ötmillió, évek óta mozdulatlan bitcoin sorsát átírják: egyesek szerint csak így védhetők meg a jövőbeli kvantumszámítógépes támadásokkal szemben, mások viszont áthághatatlan elvi tilalomnak tartják minden ilyen beavatkozást...

vasárnap 20:12

A predikciós piacok valódi ereje: nem a tömeg számít

📊 Egészen máshogy működnek a predikciós piacok, mint azt a legtöbben gondolnák...

vasárnap 20:01

Az őrült középkor: scriptorium, ahol a majomfarokból művészet lesz

Érdemes megvizsgálni, milyen őrült világot kínál a Scriptorium: itt mindenből bármi lehet, és a középkori illusztrációk határát csak a képzelet szabja...

vasárnap 19:56

A kriptomilliárdos álom Európában: keményen figyelmeztet a Bybit-vezér

💸 Érdemes megvizsgálni, hogy az európai kriptovaluta-piac szabályozása mennyire elégséges a nyereségességhez...

vasárnap 19:45

Az Imagine Dragons énekesének lövöldéje hétvégenként ingyenes

A Last Flag című új, többjátékos lövöldözős játék, amelyet az Imagine Dragons énekese, Dan Reynolds stúdiója, a Night Street fejlesztett, júniusban debütált a Steamen...

vasárnap 19:34

A mezcalos üveg alján lapuló „féreg” valódi titka

🧙 Évtizedek óta uralkodik a rejtély az alkoholos italok egyik kultikus különlegessége körül: a mezcalüvegek alján heverő, halvány és összegömbölyödött „féreg” mára szinte összenőtt a mexikói ital misztikumával...

vasárnap 19:23

Az igazi fenevad visszatér: Riddick visszavág

Érdemes megvizsgálni, hogy egy játék, amely a 2000-es évek közepén alaposan átírta a konzolos FPS-ek szabálykönyvét, több mint egy évtizeddel később is képes-e ugyanazt a sötét, vad mámort előidézni...

vasárnap 19:12

Az újabb DeFi-botrány után vége a decentralizált pénzforradalomnak?

Minden korábbinál nagyobb támadás érte a decentralizált pénzügyi rendszereket, amikor a KelpDAO-t hatalmas, 105 milliárd forintos (292 millió dolláros) kihasználás rázta meg, és emiatt a befektetők hirtelen 4600 milliárd forintot (13 milliárd dollárt) vontak ki a teljes ágazatból...

vasárnap 19:02

A palackpostára rábukkanni: van rá esélyed?

🚤 Egy ausztrál tengerparton nemrég előkerült egy százéves palack, benne egy első világháborús katona üzenetével, aki saját állítása szerint boldogabb volt, mint valaha...

vasárnap 18:56

A néma MI-hibák: minden zöld, mégis minden rossz

A vállalati MI-rendszerek legdrágább hibái gyakran nem járnak látványos leállásokkal. Nincs pirosba forduló műszerfal, sem riasztás: a rendszer látszólag hibátlanul működik, de következetesen és magabiztosan rossz eredményeket ad...

vasárnap 18:45

A bitcoinbálnák bevásárolnak, a shortosok pedig megfizetik az árát

Február óta egyre több, több mint 3,5 milliárd forintos pozíciókkal rendelkező nagy szereplő nyit agresszívan vételi (long) pozíciókat a Hyperliquid tőzsdén, ahogy a bitcoin árfolyama 21–22 millió forintról közel 28 millió forintra ugrott...

vasárnap 18:34

Az automatizálás Mekkája: végre elkészült a Shapez 2

Fontos kérdés, hogy hogyan lehet egy gyárépítős játékot mindig izgalmassá és frissé tenni...

vasárnap 18:22

A panamai óceáni mentőöv eltűnt – negyven év óta először

A Panamai-öbölben évtizedeken át minden száraz évszakban (december és április között) erős északi passzátszelek indították be a feláramlást, amely hideg, tápanyagokban gazdag vizet hozott fel a mélyből...

vasárnap 16:56

A saját Wikipédiád: építsd meg MediaWikivel már ma

A tudás megosztása sosem volt ilyen egyszerű: a wiki-rendszerek segítenek szervezeteknek, közösségeknek és egyéni kutatóknak létrehozni könnyen, közösen szerkeszthető tudástárakat...

vasárnap 16:45

A nagy DJI drónpárbaj: melyik most a legjobb vétel?

A DJI friss, 249 gramm alatti újdonsággal rukkolt elő a Lito 1 személyében, amely nagyobb szenzort, hosszabb repülési időt és fejlettebb akadályérzékelést kínál...

vasárnap 16:34

A világegyetem egyik legnagyobb rejtett óriása leleplezve

Szinte teljesen láthatatlan volt a Földről eddig az a gigantikus galaxishalmaz, amelyet végre részletesen sikerült feltérképezniük a csillagászoknak...

vasárnap 16:23

Az emberiség afrikai eredete: több ős, nem egyetlen

🚩 Érdekes felvetés, hogy az emberi faj eredetére vonatkozó, eddig széles körben elfogadott elképzelések valószínűleg túl egyszerűek voltak...

vasárnap 16:12

Az első Bloodlines 2 DLC végre helyreteszi a harcrendszert

🔴 A várva várt Vampire: The Masquerade – Bloodlines 2 tavalyi megjelenése után sokan érezhették úgy, hogy valami hiányzik a játékból...

vasárnap 16:01

Az Oppo Find X9 Ultra tarol: 2000 fotón át bizonyított

Az okostelefonos fotózás új szintre lépett az Oppo Find X9 Ultrával...

vasárnap 15:56

Az MI forradalmasítja az állami megfigyelést – riadót fújnak a képviselők

A technológia fejlődése alapjaiban változtatja meg, hogyan figyeli meg az állam polgárait...

vasárnap 15:34

A Hubble 30 év után újra célba veszi a Trifid-ködöt

🛰 Ötvenezer fényévnyi távolságból ismét elképesztő fotót készített a Hubble űrtávcső a Trifid-ködről, amely a Nyilas csillagképben található, és a csillagkeletkezés egyik ikonikus helyszíne az univerzumban...

vasárnap 15:23

A mindent tudó kriptobróker: a Coinbase újraosztja a lapokat

A Coinbase egy olyan mérföldkőhöz érkezett, amelyet a Wall Street is azonnal felismer: mostantól teljes körű prime brókerként működik a kriptopiacon...

vasárnap 15:12

Az LG C6 OLED: Lélegzetelállító fényerő, de akadnak árnyoldalak

Az LG C-sorozatos OLED tévéi évről évre a kategória legnépszerűbbjei közé tartoznak...

vasárnap 15:01

A nagy rejtély: miért rázza a fejét a macska és a kutya?

A macskáknál gyakran előfordul, hogy evés, ivás vagy alapos simogatás után villámgyorsan megrázzák a fejüket...

vasárnap 14:57

A gigászi adatközpont rekordszintű áraméhséggel fenyeget Utahban

Különleges beruházás készül Box Elder megyében, ahol Kevin O’Leary, a híres „Mr...

vasárnap 14:45

Az Enter the Gungeon tízéves: Tényleg véget ér a roguelike aranykora?

Tíz év telt el azóta, hogy megjelent az Enter the Gungeon, amely több mint 14 millió példányban kelt el, és jelentős hatást gyakorolt a modern akció-roguelike műfajra...

vasárnap 14:34

Az FA-kupa elődöntő: megingott a Chelsea, éhes a Leeds

⚽ Nem a bajnoki tabella alapján ítélhető meg, melyik csapat az esélyesebb a Chelsea–Leeds FA-kupa-elődöntőben...

vasárnap 14:23

A T. rex megőrződött vérerei átírják a dinoszaurusz-kutatást

A tudósok hosszú évtizedeken át próbáltak dinoszaurusz-DNS-t találni, eredménytelenül. Ma már a paleontológia főleg a fosszíliákban maradt eredeti szerves anyagok nyomait kutatja, de a több mint 66 millió év során a DNS teljesen elpusztult...

vasárnap 13:56

Tűz az amerikai bombázók brit bázisán – csak egy üres épület égett

Hajnalban hatalmas tűz ütött ki a Gloucestershire melletti RAF Fairford katonai repülőtéren, ahol jelenleg is amerikai egységek állomásoznak...