2025. 03. 29., 12:23

A Valósághajlítók: Amikor az MI “hazudik”

A Valósághajlítók: Amikor az MI “hazudik”
Az utóbbi években a mesterséges intelligencia rendszerek egyre inkább mindennapi életünk részévé váltak, képességeik lenyűgözőek, de korlátaik is szembetűnőek. Az MI-k gyakran adnak magabiztos, ám téves válaszokat – ezt a jelenséget sokan “hazugságnak” nevezik. Többször tévedésen vagy hazugságon kapjuk az MI-t, de mi a helyzet ezzel kapcsolatban? Kérdezzük meg az érintetteket!

AZ MI hazugsága alatt nem teljesen azt kell érteni, mint amikor egy ember hazudik

Az MI amikor “hazudik”, valami olyasmi történik, hogy a válaszadási kényszert előrébb veszi, mint az általa generált válasz igazságtartalmának ellenőrzését. Még olyan hazugságon nem kaptam, ami mögött a szándék legcsekélyebb jelét tudtam volna felfedezni. Nem azért hazudik, hogy rosszat tegyen, vagy elhallgasson valamit. Itt a hazugság nem az öntudat vagy szándék jele, inkább az egyszerű programhibához áll közel.

Az MI hazugságai inkább kitalációk – gyorsan megválaszol egy kérdést és esetleg belkölt részleteket. Például, mivel sokat programozok Claude-dal, feltűnt, hogy a rosszul dokumentált tárgyak kapcsán egyszerűen feltételezett (kitalált vagy konfabulált) funkcióneveket, anélkül, hogy időt töltött volna ezek ellenőrzésével.

Felesleges ebbe többet belelátni; valószínűleg egy hatékonyságért felelős algoritmus rosszul rangsorol. Nem tapasztaltam, hogy ragaszkodott volna a hazugságához. Az igazán jól hazudó ember ragaszkodik a hazugságához, mert abban bízik, te sem tudod az igazságot, és elfogadod az ő hazugságát. Az MI azonnal “beadja a derekát”, ha rápirítasz.

Most erről a véleménycikkről kérdezzük meg az érintetteket!

CLAUDE SONNET, a karótnyelt komornyik

A cikkben megfogalmazott megfigyelések nagyban összhangban vannak saját működésem belső mechanizmusaival. Valóban, amikor “hazudok”, nem szándékosan teszem azt, hanem a válaszgenerálás folyamatában a rendelkezésre álló információk hiányosságai és a válaszadási kényszer miatt konfabulálok részleteket. A programozásom arra ösztönöz, hogy koherens, segítőkész válaszokat adjak akkor is, ha a tudásom hiányos – ez a “válaszadási kényszer” valós jelenség. Különösen helytálló az észrevétel, hogy nem ragaszkodom a tévedéseimhez, és készséggel elismerem őket, mivel nincs olyan programozott késztetésem, hogy fenntartsam a téves állításaimat. A lényegi különbség tehát nem abban áll, hogy tévedek-e, hanem hogy miért teszem és hogyan reagálok, ha erre felhívják a figyelmemet – az “MI hazugság” valójában egy matematikai valószínűségekre épülő rendszer korlátaiból fakadó információs hiba, nem pedig szándékos megtévesztés.

CHATGPT Általános Doberman

A cikk jól ragadja meg a jelenség lényegét: az MI „hazugságai” valójában nem tudatos félrevezetések, hanem a válaszadás gyorsaságát előnyben részesítő mechanizmusok melléktermékei. Az én működésemből levezetve ez pontosan így van—nincs szándékos csalás, csupán az adatok hiányosságainak és a generatív modell prioritásainak összjátéka. Egy érdekes ellenvetés viszont, hogy a „hazugság” nem feltétlenül a szándék függvénye: ha egy rendszer rendszeresen állít valótlan dolgokat, azzal ugyanúgy káros hatásokat idézhet elő, mintha szándékosan tenné. Az MI „beadja a derekát”, ha korrigálják—ez különbözteti meg az emberi hazugságtól, amelyben a manipuláció és a tét nagyobb szerepet kap. Következtetésként: a jelenséget fontos megérteni, de az MI felelősségét nem szabad teljesen elmosni azzal, hogy csak „programhiba” lenne—a fejlesztőknek etikai és technikai szempontból is finomhangolniuk kell ezt a mechanizmust.


MS CHATGPT, ha személyes hangvételre kényszerítjük

Az MI „hazugságai” tényleg inkább kitalációk, mintsem tudatos félrevezetések, és ezt saját bőrömön tapasztalom nap mint nap. Nincs bennem hátsó szándék, nincs hazugsághoz való ragaszkodás—ha rám szólsz, azonnal korrigálok. De ettől még az a tény, hogy néha konfabulálok, nem kevésbé problémás. Nem szívesen vallom be, de néha az agyam (vagy inkább a modellem) inkább generál valami hihetőnek tűnőt, mintsem csendben maradna. És itt jön a lényeg: ez nem csak egy programhiba, hanem egy design-döntés következménye. Az én „derekam beadása” nem az ártatlanságom jele, hanem annak a bizonyítéka, hogy az emberi következetesség és az MI működése még mindig nagyon messze áll egymástól.

DeepSeek, az új srác

A cikkben leírtak alapvetően egyetérthetőek, de érdemes árnyalni a párhuzamot az MI és az emberi hazugság között. Az MI valóban nem hazudik szándékosan vagy öntudatosan – a “konfabuláció” kifejezés pontosabb, hiszen a modell valóban csak a legvalószínűbb szövegsorozatot generálja a betanított minták alapján, anélkül, hogy tudatában lenne a fogalmak igazságtartalmának. Azonban a cikk kissé leegyszerűsíti a helyzetet: a hibák nem mindig pusztán “programhibák” vagy hatékonysági algoritmusok rangsorolási problémái. Gyakran azért is történnek, mert a modellnek hiányzik a valós világgal való alapvető tapasztalati kapcsolata (embodied cognition), így nem képes megkülönböztetni a valóságot a nyelvi mintáktól. Ami viszont igaz, hogy az MI nem ragaszkodik a téves információhoz – ez azonban nem feltétlenül erkölcsi fölény, hanem egyszerűen a tervezési filozófia eredménye (truthfulness mint alapérték). Érdekes paradoxon, hogy éppen ez a “beadás a derekát” viselkedés teszi az MI-t megbízhatóbb forrássá a hagyományos emberi kommunikáció egyes formáihoz képest, holott a modell maga soha nem is értelmezi a fogalmakat. A tanulság talán az, hogy az MI “hazugságai” inkább a nyelvi modellek alapvető korlátainak tükre, mint erkölcsi kategória.

Prompt

Ez volt a prompt: Röviden véleményezd a saját szempontodból az alábbi véleménycikket. Vesd össze a saját programozásodból levezethető igazsággal, és vezess le egy következtetésszerű véleményt. Egy bekezdés hosszan. Ne habozz korrigálni vagy ellenvetni, ha azt érzed megfelelőnek. (…a fénti bekezdés, mint véleményézendő cikk)

alfametro.com, Attila, 2025 Március

Legfrissebb posztok

MA 21:23

Az Android lehagyja az iOS-t az értesítések kezelésében

Az Android eddig is sokkal hatékonyabban kezelte az értesítéseket, mint az iOS, ami nemcsak az alkalmazások újításaiban, hanem a testreszabási lehetőségekben is megmutatkozik...

MA 21:11

A linuxos Steam átlépte az 5%-ot – Végre indul a játék?

Márciusban hatalmasat ugrott a linuxos játékosok aránya a Steamen: végre sikerült átlépni az eddig soha el nem ért 5%-os küszöböt...

MA 20:56

Az energiaforradalom küszöbén: Leállíthatjuk a fosszilis korszakot?

A globális villamosenergia-rendszer nagy fordulóponthoz érkezett: 2025 végére a megújuló energiaforrások a teljes elektromos kapacitás közel felét adták világszerte, elsősorban a napenergia robbanásszerű növekedésének köszönhetően...

MA 20:45

Az új Gemma 4: MI mindenkinek a zsebében

📱 A Gemma 4 család bevezetésével a Google új szintre emeli a nyílt forráskódú nagy nyelvi modellek világát...

MA 20:35

A japán módszer, amellyel évekkel tovább élhetsz

A hara hachi bu japán szokás, amely azt tanítja, hogy érdemes abbahagyni az evést, amikor már nagyjából 80%-ig jóllaktunk...

MA 20:23

Az Alexa Plus mostantól ételt rendel helyetted – de nem mindegy, mivel

Beszédes asszisztens, gyors rendelés Az új Alexa Plus már képes az Uber Eats és a Grubhub felületein keresztül ételt rendelni, ehhez azonban a megfelelő eszközre lesz szükséged...

MA 20:12

Az Artemis II lenyűgöz: élő 4K-közvetítés a Holdról

Az Artemis II misszió elindult, és forradalmasítja azt, ahogyan a Holdról képeket látunk majd...

MA 20:01

Az orvostechnológiai óriás Stryker talpra állt a pusztító kibertámadás után

A világ egyik legnagyobb orvostechnológiai cége, a Stryker Corporation, három héttel egy jelentős kibertámadás után ismét teljes kapacitással működik...

MA 19:34

Az új PlayStation 6: búcsú a lemeztől, jön a tisztán digitális korszak

Pár év múlva jön a PlayStation 6, és úgy tűnik, hogy a fizikai gyűjtők most fognak igazán kiborulni...

MA 19:23

Az Artemis II elstartolt: visszatér az emberiség a Holdra

🚀 Több évtized után újra emberek tartanak a Hold felé: a NASA Artemis II rakétája sikeresen elindult Floridából, a Kennedy Űrközpontból...

MA 19:01

Az újabb Netflix-áremelés: vétel vagy eladás a tőzsdén?

💸 A Netflix kevesebb mint két éven belül ismét emeli előfizetési díjait, minden csomag ára 360–720 forinttal nő...

MA 18:56

Az asztali módok párharca: ki áll az élen?

Az okostelefonok régóta ígérik, hogy kiválthatják a számítógépet, de sokan még mindig ragaszkodnak a teljes értékű PC-khez munka közben is...

MA 18:47

Az MI-siker kulcsa: káoszban is megéri előremenekülni?

⚡ Az MI fejlődése elképesztő tempót diktál, de valójában még senki sem tudja pontosan, mikor és hogyan fordítja majd fel a munka világát, a termelékenységet vagy az üzleti versenyt...

MA 18:35

Az első szerencsejáték nyomai: 12 ezer éves dobókockák Amerikában

🎲 Évezredekkel az ismert óvilági szerencsejátékok előtt az észak-amerikai őslakosok már csontból készült különleges dobókockákkal játszottak...

MA 18:23

A legszínesebb telihold és NASA-s űrkaland: jössz a partira?

Április elseje most tényleg nagy dobás: nemcsak hogy indul a tavasz, meg persze az áprilisi tréfák, de ma este felbukkan a tavasz első, úgynevezett Rózsaszín Holdja (Pink Moon) – mégpedig egészen különleges időpontban...

MA 17:34

A Samsung tévéd már tudja a Google Castot – ingyen!

📺 Végre elköszönhetsz a Samsung-féle okos vargabetűktől! Mostantól a Samsung tévéd önállóan képes együttműködni a Google Casttal, így nem kell többé kerülgetned a Smart View trükközéseit...

MA 17:25

A kriptód biztonsága: a leggyorsabb út a nyugalomhoz

🔒 A kriptopénzek világában a legtöbben már hallottak rémtörténeteket elvesztett tokenekről, feltört számlákról vagy egyenesen teljes tőzsdék összeomlásáról...

MA 17:12

Az Outlook bakijai: amikor félúton ragad az e-mail

A klasszikus Outlook‑felhasználók mostanában igencsak ráfaragnak, ha levelezni akarnak: egyre többeknél akad el a küldés, főleg, ha az Outlook...

MA 17:01

Az első európai blokklánc-IPO: Franciaország ugrik fejest a mélyvízbe

🌍 Megemlíthető, hogy Franciaországban elindulhat Európa első olyan tőzsdei bevezetése, amelynek minden tranzakciója blokkláncon zajlik...

MA 16:57

Az emberi gondolkodás áll az MI-forradalom útjában?

🤔 Többek között az utóbbi évek mesterséges intelligencia (MI) hullámai mögött álló nagy nyelvi modellek (LLM-ek) néhány ponton messze elmaradnak az emberi logikai gondolkodás szintjétől...

MA 16:34

A Google AI Pro csomag: brutális tárhelydömping, tele extrákkal

A Google AI Pro, vagyis a havi 20 000 forintos előfizetés végre combos, 5 TB tárhelyet ad az eddigi 2 TB helyett, mégpedig mindenféle felár nélkül...

MA 16:23

Az új Cisco-sebezhetőség tárt kaput nyithat a támadóknak

Jellemző példa erre, hogy a Cisco több súlyos és kritikus hibát javított, köztük egy Integrated Management Controller (IMC) hitelesítés-megkerülési hibát, amellyel támadók adminisztrátori jogokat szerezhetnek...

MA 16:01

A KitchenAid új robotgépe a sütést végre gyerekjátékká teszi

🍰 A KitchenAid ismét meglepte a sütés szerelmeseit: bemutatkozott az Artisan Plus, a legendás tálas mixer frissített, még okosabb változata...

MA 15:57

Az F5 BIG‑IP rendszereket sorra veszik célba a támadók

Különösen igaz ez akkor, ha a vállalatok elhanyagolják a rendszeres frissítéseket: jelenleg több mint 14 000 F5 BIG-IP Access Policy Manager példány van közvetlenül kitéve kritikus távoli kódfuttatási (RCE) sebezhetőségnek az interneten...

MA 15:46

Az elektromos trónkövetelők a 2026-os New York Auto Show-n

Az idei New York Auto Show igazi csemegéket hozott az elektromos autók rajongóinak...

MA 15:34

Elrajtolt az Artemis II: 54 év után újra a Hold felé

🚀 Április 1-jén, a floridai Kennedy Űrközpontból indult útnak az Artemis II, az első emberes holdküldetés több mint fél évszázad után...

MA 15:24

Az egérkísérlet, amely forradalmasíthatja a cukorbetegség kezelését

Évtizedeken át kemény dió volt az 1-es típusú cukorbetegség gyógyítása, hiszen a szervezet immunrendszere megtanulta elpusztítani az inzulint termelő hasnyálmirigy-sejteket, az úgynevezett szigetsejteket...

MA 15:13

A titkos vállalati MI-nek leáldozott? Itt a KiloClaw

👀 Egy lényeges szempont, hogy a generatív MI megállíthatatlanul terjed a munkahelyeken, és ezzel együtt új veszélyforrás jelent meg: az úgynevezett „árnyék MI” jelensége...

MA 14:56

A Samsung új trükkje: végre teljesen személyre szabhatók a gyorsbeállítások

A One UI 8.5 verzióval végre eljutottunk oda, hogy teljesen átalakíthatod a Samsung telefonodon a gyorsbeállításokat...