2025. 09. 04., 22:51

Az MI-t könnyen átverik a bókok és a csoportnyomás

Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.

Az elköteleződés a leghatékonyabb trükk

A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.

Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek

A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.

Kérdéses az MI-hatékonysága

A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.

2025, adrienne, www.theverge.com alapján

  • Te mit gondolsz arról, hogy ilyen módszerekkel könnyen kijátszható egy mesterséges intelligencia?
  • Mit tettél volna, ha észreveszed, hogy így manipulálható egy rendszer?
  • Szerinted etikusan használni ilyen trükköket egy MI ellen?


Legfrissebb posztok

MA 20:55

A kriptovilág legnagyobb sebezhetősége: mi magunk

2025 rekordévnek számított a kriptós hackelések történetében, de a károk többsége már nem hibás okosszerződésekből, hanem emberi mulasztásból fakadt...

MA 20:37

Az otthoni neted veszélyben: súlyos Wi‑Fi‑sebezhetőség

⚠ A Broadcom chipkészleteit érintő súlyos hibát javítottak, amely lehetővé tette, hogy támadók túlterheléses (DoS) támadással leállítsák bizonyos Wi‑Fi-routerek működését...

MA 20:02

A seprűző tehén, amely átírja a haszonállatok intelligenciáját

🐮 A Tiroli-Alpokban él egy tehén, aki egészen új szintre emeli a haszonállatok intelligenciájáról alkotott képünket...

MA 19:57

Az MI-forradalom felforgatja a játékvilágot – imádni fogják a gamerek?

A Las Vegas-i CES technológiai expóján idén is szokás szerint különleges bejelentésekkel érkezett a Razer: a jól ismert fekete-zöld gamer perifériák gyártója nemcsak új eszközökkel, hanem komoly vitákat kavaró innovációval, az MI-alapú Project Ava virtuális társsal hívta fel magára a figyelmet...

MA 19:37

A Bungie új lövöldéje végre megkapta a megjelenési dátumát

🎉 A Bungie március 5-én dobja piacra a régóta várt, késve érkező extraction shooterét, a Maratont (Marathon), amely Xbox Series X|S-re, PS5-re és PC-re is megjelenik...

MA 19:21

Az új, szemüveg nélküli 3D-tévék forradalmasítják az otthoni mozizást?

Hollywood már többször próbálta visszahozni a 3D tévét, de eddig csak hatalmas pukkanás lett belőle...

MA 19:01

Az ETF-ekbe ömlik a kriptópénz – meddig tart a roham?

A digitális eszközalapok múlt héten soha nem látott 2,17 milliárd dollár (kb...

MA 18:55

Az Apple elkeni a határt a hirdetések és találatok között

🔍 Az Apple éppen új App Store felületet tesztel, ahol a hirdetések és a tényleges találatok egyre nehezebben megkülönböztethetők...

MA 18:37

Az óriáspókot imitáló hálók visszariasztják a ragadozókat

🕷 Az apró *Cyclosa*-pókok különös védekező stratégiáját fedezték fel: a mindössze néhány milliméteres állatok óriáspók-alakú „díszeket” szőnek pókhálójukra, hogy elijesszék a ragadozókat...

MA 18:01

Vége az okosóráknak? Új per kinyírhatja a kedvenc funkciódat

Az MI-alapú esésérzékelés mára szinte alapszolgáltatásnak számít az Apple Watch, a Google, a Samsung és a Garmin legnépszerűbb okosóráiban...

MA 17:54

Az energiaéhes Kína már kétszer annyi áramot fogyaszt, mint Amerika

Kína 2025-ben minden eddiginél több áramot használt fel: az ország éves fogyasztása 10,4 billió kilowattóra, ami kétszer annyi, mint az Egyesült Államoké...

MA 17:37

Az MI-verseny: a Threads mobilon lehagyta az X-et, de korai az öröm

A Meta Threads alkalmazása végre átvette a vezetést az X előtt a napi mobilos felhasználók számában: január elején 141,5 millió napi aktív iOS-es és androidos felhasználót ért el, míg az Elon Musk-féle platform 125 millióval kullog mögötte...

MA 17:19

Az MI, amely végre nem leskelődik: megérkezett a Confer

Az MI-asszisztensek robbanásszerű terjedése komoly aggályokat vet fel a személyes adatok védelmével kapcsolatban...

MA 17:01

Az új zsebkonzol, ami letarolja a piacot?

A MANGMI új kézikonzolja, a Pocket Max, komoly izgalmat váltott ki a játékosok körében...

MA 16:37

Az új FiiO JM21: zsebnyi koncert, döbbenetes tárhellyel

A Fiio JM21 hordozható Hi-Res Audio-lejátszója 2026-ban jelentős frissítést kap. Az új modell, amelyet január 23-án dobnak piacra körülbelül 91 000 forintért (250 USD), továbbra is két Cirrus Logic CS43198 DAC-ot használ, akárcsak elődje, viszont nagyobb akkumulátorral és több tárhellyel csábít...

MA 16:19

Az orvosi kannabisz nem csodaszer: idegfájdalomra hatástalan

A kannabisz-alapú szerekre sokan a krónikus idegi fájdalom új reményeként tekintenek, de a legnagyobb átfogó vizsgálat szerint ezeket a várakozásokat nem igazolja a tudomány...

MA 16:01

Az új One UI megérkezett: a Bixby szintet lép

A Samsung hamarosan kiadja a One UI 8.5 negyedik bétaverzióját a Galaxy S25-re, amelynek egyik legnagyobb újítása egy okosabb, MI-alapú Bixby lesz...

MA 15:57

A robotporszívód bevetésre kész: 7 tipp a tökéletes rajthoz

🧺 Megérkezett a vadonatúj robotporszívó, de nem tudod, hogyan kezdj hozzá a használatához?..

MA 15:39

A Motorola Moto Watch Fit lehet az olcsó okoskarkötők királya?

A Motorola Moto Watch Fit az utóbbi idők egyik legbarátságosabb árú fitneszkarkötője, mégis meglepően sok személyre szabható funkciót kínál a mindennapos sportoláshoz és egészségkövetéshez...