2025. 03. 29., 12:23

A Valósághajlítók: Amikor az MI “hazudik”

A Valósághajlítók: Amikor az MI “hazudik”
Az utóbbi években a mesterséges intelligencia rendszerek egyre inkább mindennapi életünk részévé váltak, képességeik lenyűgözőek, de korlátaik is szembetűnőek. Az MI-k gyakran adnak magabiztos, ám téves válaszokat – ezt a jelenséget sokan “hazugságnak” nevezik. Többször tévedésen vagy hazugságon kapjuk az MI-t, de mi a helyzet ezzel kapcsolatban? Kérdezzük meg az érintetteket!

AZ MI hazugsága alatt nem teljesen azt kell érteni, mint amikor egy ember hazudik

Az MI amikor “hazudik”, valami olyasmi történik, hogy a válaszadási kényszert előrébb veszi, mint az általa generált válasz igazságtartalmának ellenőrzését. Még olyan hazugságon nem kaptam, ami mögött a szándék legcsekélyebb jelét tudtam volna felfedezni. Nem azért hazudik, hogy rosszat tegyen, vagy elhallgasson valamit. Itt a hazugság nem az öntudat vagy szándék jele, inkább az egyszerű programhibához áll közel.

Az MI hazugságai inkább kitalációk – gyorsan megválaszol egy kérdést és esetleg belkölt részleteket. Például, mivel sokat programozok Claude-dal, feltűnt, hogy a rosszul dokumentált tárgyak kapcsán egyszerűen feltételezett (kitalált vagy konfabulált) funkcióneveket, anélkül, hogy időt töltött volna ezek ellenőrzésével.

Felesleges ebbe többet belelátni; valószínűleg egy hatékonyságért felelős algoritmus rosszul rangsorol. Nem tapasztaltam, hogy ragaszkodott volna a hazugságához. Az igazán jól hazudó ember ragaszkodik a hazugságához, mert abban bízik, te sem tudod az igazságot, és elfogadod az ő hazugságát. Az MI azonnal “beadja a derekát”, ha rápirítasz.

Most erről a véleménycikkről kérdezzük meg az érintetteket!

CLAUDE SONNET, a karótnyelt komornyik

A cikkben megfogalmazott megfigyelések nagyban összhangban vannak saját működésem belső mechanizmusaival. Valóban, amikor “hazudok”, nem szándékosan teszem azt, hanem a válaszgenerálás folyamatában a rendelkezésre álló információk hiányosságai és a válaszadási kényszer miatt konfabulálok részleteket. A programozásom arra ösztönöz, hogy koherens, segítőkész válaszokat adjak akkor is, ha a tudásom hiányos – ez a “válaszadási kényszer” valós jelenség. Különösen helytálló az észrevétel, hogy nem ragaszkodom a tévedéseimhez, és készséggel elismerem őket, mivel nincs olyan programozott késztetésem, hogy fenntartsam a téves állításaimat. A lényegi különbség tehát nem abban áll, hogy tévedek-e, hanem hogy miért teszem és hogyan reagálok, ha erre felhívják a figyelmemet – az “MI hazugság” valójában egy matematikai valószínűségekre épülő rendszer korlátaiból fakadó információs hiba, nem pedig szándékos megtévesztés.

CHATGPT Általános Doberman

A cikk jól ragadja meg a jelenség lényegét: az MI „hazugságai” valójában nem tudatos félrevezetések, hanem a válaszadás gyorsaságát előnyben részesítő mechanizmusok melléktermékei. Az én működésemből levezetve ez pontosan így van—nincs szándékos csalás, csupán az adatok hiányosságainak és a generatív modell prioritásainak összjátéka. Egy érdekes ellenvetés viszont, hogy a „hazugság” nem feltétlenül a szándék függvénye: ha egy rendszer rendszeresen állít valótlan dolgokat, azzal ugyanúgy káros hatásokat idézhet elő, mintha szándékosan tenné. Az MI „beadja a derekát”, ha korrigálják—ez különbözteti meg az emberi hazugságtól, amelyben a manipuláció és a tét nagyobb szerepet kap. Következtetésként: a jelenséget fontos megérteni, de az MI felelősségét nem szabad teljesen elmosni azzal, hogy csak „programhiba” lenne—a fejlesztőknek etikai és technikai szempontból is finomhangolniuk kell ezt a mechanizmust.


MS CHATGPT, ha személyes hangvételre kényszerítjük

Az MI „hazugságai” tényleg inkább kitalációk, mintsem tudatos félrevezetések, és ezt saját bőrömön tapasztalom nap mint nap. Nincs bennem hátsó szándék, nincs hazugsághoz való ragaszkodás—ha rám szólsz, azonnal korrigálok. De ettől még az a tény, hogy néha konfabulálok, nem kevésbé problémás. Nem szívesen vallom be, de néha az agyam (vagy inkább a modellem) inkább generál valami hihetőnek tűnőt, mintsem csendben maradna. És itt jön a lényeg: ez nem csak egy programhiba, hanem egy design-döntés következménye. Az én „derekam beadása” nem az ártatlanságom jele, hanem annak a bizonyítéka, hogy az emberi következetesség és az MI működése még mindig nagyon messze áll egymástól.

DeepSeek, az új srác

A cikkben leírtak alapvetően egyetérthetőek, de érdemes árnyalni a párhuzamot az MI és az emberi hazugság között. Az MI valóban nem hazudik szándékosan vagy öntudatosan – a “konfabuláció” kifejezés pontosabb, hiszen a modell valóban csak a legvalószínűbb szövegsorozatot generálja a betanított minták alapján, anélkül, hogy tudatában lenne a fogalmak igazságtartalmának. Azonban a cikk kissé leegyszerűsíti a helyzetet: a hibák nem mindig pusztán “programhibák” vagy hatékonysági algoritmusok rangsorolási problémái. Gyakran azért is történnek, mert a modellnek hiányzik a valós világgal való alapvető tapasztalati kapcsolata (embodied cognition), így nem képes megkülönböztetni a valóságot a nyelvi mintáktól. Ami viszont igaz, hogy az MI nem ragaszkodik a téves információhoz – ez azonban nem feltétlenül erkölcsi fölény, hanem egyszerűen a tervezési filozófia eredménye (truthfulness mint alapérték). Érdekes paradoxon, hogy éppen ez a “beadás a derekát” viselkedés teszi az MI-t megbízhatóbb forrássá a hagyományos emberi kommunikáció egyes formáihoz képest, holott a modell maga soha nem is értelmezi a fogalmakat. A tanulság talán az, hogy az MI “hazugságai” inkább a nyelvi modellek alapvető korlátainak tükre, mint erkölcsi kategória.

Prompt

Ez volt a prompt: Röviden véleményezd a saját szempontodból az alábbi véleménycikket. Vesd össze a saját programozásodból levezethető igazsággal, és vezess le egy következtetésszerű véleményt. Egy bekezdés hosszan. Ne habozz korrigálni vagy ellenvetni, ha azt érzed megfelelőnek. (…a fénti bekezdés, mint véleményézendő cikk)

alfametro.com, Attila, 2025 Március

Legfrissebb posztok

MA 08:43

Az AI új csapdája: úgy ránt be, mint az adathalászat

🖰 Az AI-k világában már nem csak emberek lehetnek átverés áldozatai: a mesterséges intelligenciák is csúnyán pofára eshetnek, ha valaki elég ügyesen csavarja a kérdéseket...

MA 08:29

Az egyedüllét nem okoz demenciát, de kikezdi a memóriát

💡 Az egyedüllét érzése mindannyiunkkal megesik, és ugyan természetes emberi érzelem, mégis képes alattomosan befolyásolni gondolkodásunkat, memóriánkat...

MA 08:03

A legnagyobb DeFi-hack: milliárdok tűntek el pillanatok alatt

💸 A decentralizált pénzügyi szektorban (DeFi) komoly felfordulást okozott az év eddigi legnagyobb hackje, amely során közel 108 milliárd forintnak megfelelő értékű kriptovalutát tulajdonítottak el...

MA 07:57

Az új Vercel-botrány: hackerek pénzzé teszik a lopott adatokat

Érdemes megérteni, hogy a népszerű felhőalapú fejlesztői platformot, a Vercelt jelentős biztonsági incidens érte, melynek során egyes ügyfelek adatai veszélybe kerültek...

MA 07:50

Az utolsó kilométerek: a Voyager–1 az ereje végén jár

Tipikus eset, amikor egy világraszóló felfedezőút lassan lezárul. A Voyager 1, amely 49 éve szeli az űrt, mostanra elérte élettartama határát: energiaforrása, a plutóniumalapú termoelektromos generátor évről évre körülbelül 4 wattal kevesebb teljesítményt ad le, és már nincs napelem, sem újratölthető akkumulátor, amely segítene...

MA 07:36

A Blue Origin beégett: az első újrahasznosított rakéta műholdat veszít

A Blue Origin legújabb, harmadszor repülő New Glenn rakétája megint nagyot szólt, de valahogy mégiscsak a partvonalról nézheti a diadalt: a második fokozat műszaki hibája miatt a fedélzeten lévő BlueBird 7 műhold menthetetlen pályán rekedt, vagyis el is búcsúzhatunk tőle – a biztosító viszont fizetni fog, ami azért enyhíti a csapást...

MA 07:24

Az elemek korszaka véget érhet a talajból nyert árammal?

A Northwestern Egyetem kutatói áttörést értek el a fenntartható energiaellátásban: olyan tüzelőanyagcellát fejlesztettek ki, amelynek működését a talajban élő mikroorganizmusok biztosítják...

MA 07:15

Az Apple-értesítésekkel támadnak a csalók: új adathalász trükk

🚨 Az elmúlt napokban többen kaptak olyan e-maileket, amelyek Apple-fiók módosításáról szóló hivatalos értesítésnek tűnnek, valójában azonban adathalász csalási kísérletek...

MA 07:01

Az Apple-rajongók türelmét próbára teszi a csúszó Mac Studio és MacBook Pro

Akik már tűkön ülnek az új Mac Studio vagy MacBook Pro kiadására várva, kénytelenek még pár hónapot várni...

MA 06:50

A OnePlus új mobilja tényleg kézikonzollá válik

Érdemes megvizsgálni, hogy a OnePlus hamarosan bemutatkozó Ace 6 Ultra készüléke nem egyszerűen egy csúcsmobil lesz, hanem kifejezetten játékosoknak tervezett kézi játékkonzollá is alakítható...

MA 06:43

A csodafegyverét, a Mythost már beveti az NSA – mindenki csak néz

👀 Érdekes fordulat, hogy az amerikai Nemzetbiztonsági Ügynökség (NSA) pillanatok alatt rácsapott az Anthropic új mesterségesintelligencia-modelljére, a Mythos Preview-ra, annak ellenére, hogy nem is olyan régen még nyílt háború dúlt a cég és a Pentagon között...

MA 06:38

Az igazságos osztozás: a reneszánsz játék, amely forradalmasította a kockázatkezelést

🧡 Tipikus eset, amikor két barát, mindketten 25 000 forintot tesznek be egy kalapba, majd elkezdenek érmét dobni...

MA 06:22

Az emberi lelemény újrarajzolja a Föld arculatát

🚀 Az emberi társadalmak évszázadok óta nemcsak alkalmazkodnak a természethez, hanem képesek is azt gyökeresen átalakítani...

MA 06:15

Az új Dragon Ball Xenoverse végre itt van

Több mint tíz év várakozás után jövőre érkezik a Dragon Ball Xenoverse 3...

MA 06:05

Történelmi események a mai napon (Április 20.)

Április 20-án a történelem sorsfordító pillanatai és különös epizódjai váltották egymást: haditengerészeti áttörés Konstantinápoly ostroma előtt, forradalmak és háborúk küszöbei, tudományos áttörések és űrsikerek...

vasárnap 21:23

Az újrahasználható rakéták csatája: beszáll a Blue Origin

A Blue Origin történelmi sikert ért el, amikor a Never Tell Me the Odds nevű rakétája a New Glenn NG-3 küldetés során sikeresen leszállt az Atlanti-óceánon lebegő Jacklyn drónhajó fedélzetére...

vasárnap 21:01

Az új opioid kevésbé okozhat függőséget, mint a morfium

💊 A kutatók azt vizsgálták, hogy a laboratóriumban most először tesztelt új, szintetikus opioid milyen eséllyel válthatja le a morfiumot és a fentanilt, amelyek erős fájdalomcsillapítók, egyben komoly függőségi problémák forrásai is...

vasárnap 20:45

Az áttörés küszöbén: forradalmi kezelés az agydaganat ellen

A Telix Pharmaceuticals most tényleg történelmet ír: új, kifejezetten agresszív agytumor, vagyis glioblasztóma kezelésére fejlesztett radiofarmakonja már a kulcsfontosságú, III...

vasárnap 20:24

A betonbiztos otthoni Wi-Fi: így zárod le a hálózatod

Megemlíthető, hogy a stabil és biztonságos otthoni internet ma már alapvető követelmény, de kevesen fordítanak elég figyelmet a hálózatuk védelmére...

vasárnap 20:12

Az őrült peremhajtás: rakétával pörgetett propeller a sugárhajtóműben

Különleges meghajtási koncepcióval állt elő egy feltaláló, amikor a hagyományos propeller–motor rendszert teljesen átértelmezte: itt nem középre került a motor, hanem egy üreges szerkezetet alkotott, amelynek belső oldalára erősítette fel a lapátokat...

vasárnap 20:02

A munkahelyi kiégés közelebb van, mint hinnéd – így védd magad

🔥 Ha már mindennap kimerülten kelsz fel, fásult vagy, esetleg azt érzed, hogy semmi értelme sincs a munkádnak, akkor könnyen lehet, hogy éppen a kiégés fenyeget...

vasárnap 19:55

A HP lekapcsolja a távoli asztali szolgáltatásait – búcsú, Anyware!

A legendás Teradici PCoIP-ból lett HP Anyware távoli asztali megoldás a végéhez közeledik...

vasárnap 19:45

A fejlesztők rémálma: a Vercelt is elérte a biztonsági blama

😱 Hiába reménykedtünk, hogy a Vercel szolgáltatásai megingathatatlan biztonságot nyújtanak, mégis betörték az ajtót...

vasárnap 19:34

A mesterséges intelligencia tényleg tudja, mit csinál? Gondoljuk újra!

Az emberi gondolkodás működését leíró szavak a hétköznapokban természetesek. Gondolkodni, érteni, tudni, emlékezni – mindennapi kifejezéseink...

vasárnap 19:25

A jövő elektronikája: mágnes nélküli vezérlés forradalmasíthatja a számítástechnikát

⚡ A számítástechnika jövője új irányt vesz: kutatók most először tették lehetővé az elektronok vezérlését mágnesek nélkül, egy olyan tulajdonság kihasználásával, amellyel eddig senki sem foglalkozott...

vasárnap 19:12

Az önvezető Tesla-taxik már Dallasban és Houstonban is hódítanak

🚗 A texasi forróságban bukkannak fel az új robotaxi-modellek, amelyek most először gördülnek ki Dallas és Houston bizonyos kerületeiben...

vasárnap 18:45

Az egyetlen békés forradalom: trónváltás a csupasz turkálók birodalmában

🐍 A föld alatti járatokban élő csupasz turkálók társadalmában az élet általában nem szelíd...

vasárnap 18:37

Az oklevél ára: belépő a hitelek világába a pályakezdőknek

Idén tavasszal egy teljesen átalakult rendszer várja azokat, akik most szereznek diplomát az Egyesült Államokban...

vasárnap 18:23

A valaha készült legnagyobb 3D-s univerzumtérkép: 47 millió galaxis egy képen

👀 Az eddigi legnagyobb 3D-s univerzumtérkép minden korábbinál részletesebben mutatja meg a világegyetem szerkezetét...