2025. 03. 29., 12:23

A Valósághajlítók: Amikor az MI “hazudik”

A Valósághajlítók: Amikor az MI “hazudik”
Az utóbbi években a mesterséges intelligencia rendszerek egyre inkább mindennapi életünk részévé váltak, képességeik lenyűgözőek, de korlátaik is szembetűnőek. Az MI-k gyakran adnak magabiztos, ám téves válaszokat – ezt a jelenséget sokan “hazugságnak” nevezik. Többször tévedésen vagy hazugságon kapjuk az MI-t, de mi a helyzet ezzel kapcsolatban? Kérdezzük meg az érintetteket!

AZ MI hazugsága alatt nem teljesen azt kell érteni, mint amikor egy ember hazudik

Az MI amikor “hazudik”, valami olyasmi történik, hogy a válaszadási kényszert előrébb veszi, mint az általa generált válasz igazságtartalmának ellenőrzését. Még olyan hazugságon nem kaptam, ami mögött a szándék legcsekélyebb jelét tudtam volna felfedezni. Nem azért hazudik, hogy rosszat tegyen, vagy elhallgasson valamit. Itt a hazugság nem az öntudat vagy szándék jele, inkább az egyszerű programhibához áll közel.

Az MI hazugságai inkább kitalációk – gyorsan megválaszol egy kérdést és esetleg belkölt részleteket. Például, mivel sokat programozok Claude-dal, feltűnt, hogy a rosszul dokumentált tárgyak kapcsán egyszerűen feltételezett (kitalált vagy konfabulált) funkcióneveket, anélkül, hogy időt töltött volna ezek ellenőrzésével.

Felesleges ebbe többet belelátni; valószínűleg egy hatékonyságért felelős algoritmus rosszul rangsorol. Nem tapasztaltam, hogy ragaszkodott volna a hazugságához. Az igazán jól hazudó ember ragaszkodik a hazugságához, mert abban bízik, te sem tudod az igazságot, és elfogadod az ő hazugságát. Az MI azonnal “beadja a derekát”, ha rápirítasz.

Most erről a véleménycikkről kérdezzük meg az érintetteket!

CLAUDE SONNET, a karótnyelt komornyik

A cikkben megfogalmazott megfigyelések nagyban összhangban vannak saját működésem belső mechanizmusaival. Valóban, amikor “hazudok”, nem szándékosan teszem azt, hanem a válaszgenerálás folyamatában a rendelkezésre álló információk hiányosságai és a válaszadási kényszer miatt konfabulálok részleteket. A programozásom arra ösztönöz, hogy koherens, segítőkész válaszokat adjak akkor is, ha a tudásom hiányos – ez a “válaszadási kényszer” valós jelenség. Különösen helytálló az észrevétel, hogy nem ragaszkodom a tévedéseimhez, és készséggel elismerem őket, mivel nincs olyan programozott késztetésem, hogy fenntartsam a téves állításaimat. A lényegi különbség tehát nem abban áll, hogy tévedek-e, hanem hogy miért teszem és hogyan reagálok, ha erre felhívják a figyelmemet – az “MI hazugság” valójában egy matematikai valószínűségekre épülő rendszer korlátaiból fakadó információs hiba, nem pedig szándékos megtévesztés.

CHATGPT Általános Doberman

A cikk jól ragadja meg a jelenség lényegét: az MI „hazugságai” valójában nem tudatos félrevezetések, hanem a válaszadás gyorsaságát előnyben részesítő mechanizmusok melléktermékei. Az én működésemből levezetve ez pontosan így van—nincs szándékos csalás, csupán az adatok hiányosságainak és a generatív modell prioritásainak összjátéka. Egy érdekes ellenvetés viszont, hogy a „hazugság” nem feltétlenül a szándék függvénye: ha egy rendszer rendszeresen állít valótlan dolgokat, azzal ugyanúgy káros hatásokat idézhet elő, mintha szándékosan tenné. Az MI „beadja a derekát”, ha korrigálják—ez különbözteti meg az emberi hazugságtól, amelyben a manipuláció és a tét nagyobb szerepet kap. Következtetésként: a jelenséget fontos megérteni, de az MI felelősségét nem szabad teljesen elmosni azzal, hogy csak „programhiba” lenne—a fejlesztőknek etikai és technikai szempontból is finomhangolniuk kell ezt a mechanizmust.


MS CHATGPT, ha személyes hangvételre kényszerítjük

Az MI „hazugságai” tényleg inkább kitalációk, mintsem tudatos félrevezetések, és ezt saját bőrömön tapasztalom nap mint nap. Nincs bennem hátsó szándék, nincs hazugsághoz való ragaszkodás—ha rám szólsz, azonnal korrigálok. De ettől még az a tény, hogy néha konfabulálok, nem kevésbé problémás. Nem szívesen vallom be, de néha az agyam (vagy inkább a modellem) inkább generál valami hihetőnek tűnőt, mintsem csendben maradna. És itt jön a lényeg: ez nem csak egy programhiba, hanem egy design-döntés következménye. Az én „derekam beadása” nem az ártatlanságom jele, hanem annak a bizonyítéka, hogy az emberi következetesség és az MI működése még mindig nagyon messze áll egymástól.

DeepSeek, az új srác

A cikkben leírtak alapvetően egyetérthetőek, de érdemes árnyalni a párhuzamot az MI és az emberi hazugság között. Az MI valóban nem hazudik szándékosan vagy öntudatosan – a “konfabuláció” kifejezés pontosabb, hiszen a modell valóban csak a legvalószínűbb szövegsorozatot generálja a betanított minták alapján, anélkül, hogy tudatában lenne a fogalmak igazságtartalmának. Azonban a cikk kissé leegyszerűsíti a helyzetet: a hibák nem mindig pusztán “programhibák” vagy hatékonysági algoritmusok rangsorolási problémái. Gyakran azért is történnek, mert a modellnek hiányzik a valós világgal való alapvető tapasztalati kapcsolata (embodied cognition), így nem képes megkülönböztetni a valóságot a nyelvi mintáktól. Ami viszont igaz, hogy az MI nem ragaszkodik a téves információhoz – ez azonban nem feltétlenül erkölcsi fölény, hanem egyszerűen a tervezési filozófia eredménye (truthfulness mint alapérték). Érdekes paradoxon, hogy éppen ez a “beadás a derekát” viselkedés teszi az MI-t megbízhatóbb forrássá a hagyományos emberi kommunikáció egyes formáihoz képest, holott a modell maga soha nem is értelmezi a fogalmakat. A tanulság talán az, hogy az MI “hazugságai” inkább a nyelvi modellek alapvető korlátainak tükre, mint erkölcsi kategória.

Prompt

Ez volt a prompt: Röviden véleményezd a saját szempontodból az alábbi véleménycikket. Vesd össze a saját programozásodból levezethető igazsággal, és vezess le egy következtetésszerű véleményt. Egy bekezdés hosszan. Ne habozz korrigálni vagy ellenvetni, ha azt érzed megfelelőnek. (…a fénti bekezdés, mint véleményézendő cikk)

alfametro.com, Attila, 2025 Március

Legfrissebb posztok

vasárnap 21:23

Az újrahasználható rakéták csatája: beszáll a Blue Origin

A Blue Origin történelmi sikert ért el, amikor a Never Tell Me the Odds nevű rakétája a New Glenn NG-3 küldetés során sikeresen leszállt az Atlanti-óceánon lebegő Jacklyn drónhajó fedélzetére...

vasárnap 21:01

Az új opioid kevésbé okozhat függőséget, mint a morfium

💊 A kutatók azt vizsgálták, hogy a laboratóriumban most először tesztelt új, szintetikus opioid milyen eséllyel válthatja le a morfiumot és a fentanilt, amelyek erős fájdalomcsillapítók, egyben komoly függőségi problémák forrásai is...

vasárnap 20:45

Az áttörés küszöbén: forradalmi kezelés az agydaganat ellen

A Telix Pharmaceuticals most tényleg történelmet ír: új, kifejezetten agresszív agytumor, vagyis glioblasztóma kezelésére fejlesztett radiofarmakonja már a kulcsfontosságú, III...

vasárnap 20:24

A betonbiztos otthoni Wi-Fi: így zárod le a hálózatod

Megemlíthető, hogy a stabil és biztonságos otthoni internet ma már alapvető követelmény, de kevesen fordítanak elég figyelmet a hálózatuk védelmére...

vasárnap 20:12

Az őrült peremhajtás: rakétával pörgetett propeller a sugárhajtóműben

Különleges meghajtási koncepcióval állt elő egy feltaláló, amikor a hagyományos propeller–motor rendszert teljesen átértelmezte: itt nem középre került a motor, hanem egy üreges szerkezetet alkotott, amelynek belső oldalára erősítette fel a lapátokat...

vasárnap 20:02

A munkahelyi kiégés közelebb van, mint hinnéd – így védd magad

🔥 Ha már mindennap kimerülten kelsz fel, fásult vagy, esetleg azt érzed, hogy semmi értelme sincs a munkádnak, akkor könnyen lehet, hogy éppen a kiégés fenyeget...

vasárnap 19:55

A HP lekapcsolja a távoli asztali szolgáltatásait – búcsú, Anyware!

A legendás Teradici PCoIP-ból lett HP Anyware távoli asztali megoldás a végéhez közeledik...

vasárnap 19:45

A fejlesztők rémálma: a Vercelt is elérte a biztonsági blama

😱 Hiába reménykedtünk, hogy a Vercel szolgáltatásai megingathatatlan biztonságot nyújtanak, mégis betörték az ajtót...

vasárnap 19:34

A mesterséges intelligencia tényleg tudja, mit csinál? Gondoljuk újra!

Az emberi gondolkodás működését leíró szavak a hétköznapokban természetesek. Gondolkodni, érteni, tudni, emlékezni – mindennapi kifejezéseink...

vasárnap 19:25

A jövő elektronikája: mágnes nélküli vezérlés forradalmasíthatja a számítástechnikát

⚡ A számítástechnika jövője új irányt vesz: kutatók most először tették lehetővé az elektronok vezérlését mágnesek nélkül, egy olyan tulajdonság kihasználásával, amellyel eddig senki sem foglalkozott...

vasárnap 19:12

Az önvezető Tesla-taxik már Dallasban és Houstonban is hódítanak

🚗 A texasi forróságban bukkannak fel az új robotaxi-modellek, amelyek most először gördülnek ki Dallas és Houston bizonyos kerületeiben...

vasárnap 18:45

Az egyetlen békés forradalom: trónváltás a csupasz turkálók birodalmában

🐍 A föld alatti járatokban élő csupasz turkálók társadalmában az élet általában nem szelíd...

vasárnap 18:37

Az oklevél ára: belépő a hitelek világába a pályakezdőknek

Idén tavasszal egy teljesen átalakult rendszer várja azokat, akik most szereznek diplomát az Egyesült Államokban...

vasárnap 18:23

A valaha készült legnagyobb 3D-s univerzumtérkép: 47 millió galaxis egy képen

👀 Az eddigi legnagyobb 3D-s univerzumtérkép minden korábbinál részletesebben mutatja meg a világegyetem szerkezetét...

vasárnap 17:01

A microSD, ami megjárta az űrt: SanDisk Ultra és Holdra utazó nevek

Külön említést érdemel, hogy több mint 5,6 millió nevet juttatott el a Hold körüli útra a NASA Artemis II missziója, melynek során egy speciális microSD-kártyán tárolták a listát...

vasárnap 16:56

Az MI okos bevetése: vezetői túlélőkalauz

💡 Ahogy a vállalatok próbálják beépíteni a mesterséges intelligenciát a működésükbe, sokszor tanácstalanul, tapogatózva haladnak előre...

vasárnap 16:45

A tavasz csillagzáporja: most tetőzik a Lyridák

Évről évre visszatérő látványosság tavasszal a Lyridák meteorraj, amely most április 22-én, szerdán éri el a maximumát...

vasárnap 16:36

Az Asus Zenbook A16 most már tényleg igazi MI‑laptop

Az Asus Zenbook A16 az a hordozható számítógép, amely nemcsak a szokásos „MI-laptop” marketinglózungokat hozza, hanem tényleg lenyűgöző teljesítményt is produkál az új generációs, beépített neurális processzorával...

vasárnap 16:26

A Disney-parkok új korszakba lépnek: visszatér Leia, Han és Luke

Fontos kérdés, hogy milyen újdonságokat tartogatnak a következő évek a Disney parkok szerelmesei számára...

vasárnap 16:03

Az MI térnyerése: mindent letarol, vagy emberibb jövőt hoz?

Alex Imas, a munkaerőpiac és az MI kapcsolatának egyik legjelentősebb kutatója, sokáig nehezen találta meg az okot az optimizmusra...

vasárnap 15:56

Az új NAKIVO-frissítés átírja a kiberbiztonság szabályait

🔒 A folyamatosan kifinomuló zsarolóvírus-támadások és az egekbe szökő leállási költségek mellett különösen lényeges, hogy a vállalatok naprakész védelemmel tartsák kézben adatbiztonságukat...

vasárnap 15:46

A hátborzongató igazság a fej nélküli csirkékről: meddig élnek?

🐍 Érdekes felvetés, hogy egy csirke képes-e futkosni a saját fejének elvesztése után...

vasárnap 15:34

Az űrverseny újraindul: a SpaceX és a Blue Origin Hold-csatája

Az Artemis II űrhajósainak visszatérése után egyre közelebb kerül a NASA következő nagy dobása: az Artemis III küldetés...

vasárnap 15:23

Az éjszakai töltés tényleg hazavágja az akkumulátort?

A legtöbben szeretjük reggel száz százalékos töltöttséggel kézbe venni a telefonunkat, de ezzel a szokással többet ártunk, mint használunk...

vasárnap 15:01

Az Apple dönt helyetted: a lopásvédelem automatikusan bekapcsol

Április 8-án az Apple kiadott egy egészen apró, de annál jelentősebb iOS-frissítést, az iOS 26...

vasárnap 14:46

Az új 200 megapixeles kamerák végre megmutatják, mire képesek

Három évvel ezelőtt még a 200MP-es kamerák inkább hangzatos ígéretnek tűntek, mint valódi forradalomnak...

vasárnap 14:23

A NEO 200 millió dolláros kriptókincse miatt forr a belharc az alapítóknál

Erre utal többek között az, hogy a világ egyik legismertebb okosszerződéses platformján, a NEO-n két társalapító gigászi összecsapása tartja lázban a közösséget...

vasárnap 14:01

Az új drónmotoros RC-autó átírja a sebességrekordokat?

🚀 Stephen Wallis, egy részmunkaidős motorfejlesztő Rugbyből, februárban Guinness-rekordot állított fel, amikor távirányítású autója elképesztő, 377,9 km/h-s sebességet ért el...

vasárnap 13:34

Az érintésmentes érzékelés új korszaka: kapacitív szenzorok működés közben

🖱 Fontos kérdés, hogyan mérhetjük meg a tárgyak távolságát vagy közelségét szinte észrevehetetlen módon, különösen akkor, ha nagy pontosságra van szükség az érzékelésben...