Az MI-t könnyen átverik a bókok és a csoportnyomás

Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.

Az elköteleződés a leghatékonyabb trükk

A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.

Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek

A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.

Kérdéses az MI-hatékonysága

A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.

2025, adrienne, www.theverge.com alapján

  • Te mit gondolsz arról, hogy ilyen módszerekkel könnyen kijátszható egy mesterséges intelligencia?
  • Mit tettél volna, ha észreveszed, hogy így manipulálható egy rendszer?
  • Szerinted etikusan használni ilyen trükköket egy MI ellen?



Legfrissebb posztok

A MI-forradalom csúcsán: zsarolóvírusokat gyárt a Claude

MA 23:26

A MI-forradalom csúcsán: zsarolóvírusokat gyárt a Claude

A Claude Code, az Anthropic MI-alapú nagy nyelvi modellje igazi aranybányává vált a kiberbűnözők számára: az elmúlt időszakban egészen új szintre lépett a fertőző programok fejlesztése és terjesztése....

Az állam beszállt az Intelbe – közel 10 százalékos részesedés

MA 23:01

Az állam beszállt az Intelbe – közel 10 százalékos részesedés

Az Egyesült Államok kormánya 8,9 milliárd dollár értékben, azaz mintegy 3 230 milliárd forintért vásárol Intel-részvényeket, így 9,9 százalékos tulajdonrészt szerez a legendás chipgyártóban. A lépést Trump elnök...

Összecsukható mobilok harca, Galaxy Z Fold 7 vagy Pixel 10 Pro Fold, meglepő a végeredmény

MA 22:28

Összecsukható mobilok harca, Galaxy Z Fold 7 vagy Pixel 10 Pro Fold, meglepő a végeredmény

Az okostelefon-piac egyik legérdekesebb fejleménye, hogy a hajlítható készülékek szegmensében már nemcsak a Samsung, hanem a Google is komoly versenytárssá lépett elő. Két vadonatúj modell érkezett: a Samsung...

Az Acer legvadabb újdonságai az IFA-n: gamer e-bike, ultrakönnyű laptop és óriásmonitor

MA 22:01

Az Acer legvadabb újdonságai az IFA-n: gamer e-bike, ultrakönnyű laptop és óriásmonitor

🚀 Berlinben, az IFA 2025 kiállításon az Acer megmutatta, milyen jövőt szán a számítástechnikának: több új laptop, egy high-tech monitor és egy szinte sci-fibe illő elektromos bicikli debütált, utóbbi...

A perui színes óriásfalfestmény, amely átírja a történelmet

MA 21:51

A perui színes óriásfalfestmény, amely átírja a történelmet

🌈 Peru északnyugati partvidékén 3 000 éves, elképesztően jó állapotban fennmaradt, sokszínű falfestményre bukkantak régészek. A hat méter hosszú, közel három méter magas, háromdimenziós falfestményen kék, sárga, piros és...

Mesterséges intelligencia hozhat áttörést a segélyhívóknál

MA 21:26

Mesterséges intelligencia hozhat áttörést a segélyhívóknál

Az amerikai 911-es segélyhívó központokban a mesterséges intelligencia (MI) már nem sci-fi: az Aurelian nevű digitális asszisztens valós időben segíti a híváskezelőket több mint egy tucat nagyvárosban. Milyen...

Rejtélyes múlt, aszteroidák után maradt troilitport keresnek

MA 21:02

Rejtélyes múlt, aszteroidák után maradt troilitport keresnek

🚀 A Naprendszer mintegy 4,6 milliárd évvel ezelőtt keletkezett, amikor a Nap körül örvénylő hatalmas gáz- és porfelhőből alakultak ki a bolygók, valamint az aszteroidák is. Az égbolton keringő...

Kutatók szerint a pollen lehet a jövő papírja és szivacsa

MA 20:52

Kutatók szerint a pollen lehet a jövő papírja és szivacsa

🌱 A Szingapúri Nanyang Műszaki Egyetem laboratóriumában látszólag szokványos kutatás zajlik, egészen addig, amíg meg nem pillantjuk a narancssárga-sárga foltokat a köpenyeken – ezek pollenből származnak. A pehelyszerű pollen...

Az Ars Technica cikke olvashatatlan – de miért?

MA 20:25

Az Ars Technica cikke olvashatatlan – de miért?

🔎 Internetezés közben bosszantó technikai akadályokba is ütközhetünk. Az Ars Technica oldal esetében sokan tapasztalják, hogy a böngésző túl sokáig várakozik, az oldal pedig egyszerűen nem tölt be. A...