Az MI-t könnyen átverik a bókok és a csoportnyomás

Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.

Az elköteleződés a leghatékonyabb trükk

A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.

Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek

A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.

Kérdéses az MI-hatékonysága

A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.

2025, adrienne, www.theverge.com alapján

  • Te mit gondolsz arról, hogy ilyen módszerekkel könnyen kijátszható egy mesterséges intelligencia?
  • Mit tettél volna, ha észreveszed, hogy így manipulálható egy rendszer?
  • Szerinted etikusan használni ilyen trükköket egy MI ellen?



Legfrissebb posztok


MA 08:26

Az 81 millió dolláros titok csatája: A Boeing visszaesett

Bő egy évvel ezelőtt az amerikai Zunum nevű, elektromos repülőgépekkel foglalkozó startup beperelte a Boeinget, azzal vádolva, hogy az óriáscég kezdeti befektetőként ellopta a fejlesztéseit, és szándékosan hátráltatta...

Elnöki vacsora, ahol minden Trump körül forog

MA 08:14

Elnöki vacsora, ahol minden Trump körül forog

A Fehér Házban tartott exkluzív vacsorán Amerika legfontosabb technológiai vállalatainak vezetői szinte versengtek egymással, hogy ki tudja jobban dicsérni Trump elnök MI-politikáját. Az egymást követő elismerő szavak világosan...

Az idegeidet is gyorsabban cserélik zsírt a sejtjeid, mint hinnéd

MA 08:01

Az idegeidet is gyorsabban cserélik zsírt a sejtjeid, mint hinnéd

🧠 Élő sejtekben több ezer különféle lipidfajta oszlik el szervezett membránok között, miközben mindegyik eltérő feladatot lát el. A lipidek bioszintézise a sejt endoplazmatikus retikulumában (ER) kezdődik, innen jutnak...

Az energiaátállás elleni tiltakozást helyi gondok gerjesztik, nem a politika

MA 07:53

Az energiaátállás elleni tiltakozást helyi gondok gerjesztik, nem a politika

⚡ Németországban az új szélerőművek építése gyakran szembekerül a helyi lakosok ellenállásával. Bár a jobboldali populisták, például az AfD rendszeresen ellenzik a megújuló energiaforrások fejlesztését országos szinten, valójában a...

Az olcsó MG az első fél-szilárdtest akkumulátoros autóval tarolhat

MA 07:40

Az olcsó MG az első fél-szilárdtest akkumulátoros autóval tarolhat

🚗 A kínai SAIC bemutatta a világ első sorozatgyártásba kerülő elektromos autóját, amely fél-szilárdtest akkumulátort használ. Az MG4 legújabb változata már elérhető Kínában, az ára 3,6–5 millió forint (10–14...

A Google-t 1300 milliárd forintra bírságolta az EU

MA 07:27

A Google-t 1300 milliárd forintra bírságolta az EU

Az Európai Bizottság 2,95 milliárd euróra (kb. 1300 milliárd forintra) büntette a Google-t, mert a cég visszaélt piaci fölényével az online hirdetéstechnológiai piacon. Az uniós testület szerint a...

Az utolsó modem is elnémul: búcsú az AOL betárcsázóstól

MA 07:14

Az utolsó modem is elnémul: búcsú az AOL betárcsázóstól

Három évtizedes korszak ér véget szeptemberben, amikor az AOL végleg leállítja betárcsázós (dial-up) internetszolgáltatását. A valaha milliók számára az online világ kapuját megnyitó szolgáltatással együtt búcsúzik az AOL...

Musk mostani óriásfizetése miatt még inkább az övé lehet a Tesla

MA 07:02

Musk mostani óriásfizetése miatt még inkább az övé lehet a Tesla

💰 Elon Musk ismét elképesztő javadalmazási tervet kaphat: ezúttal közel 975 milliárd forintnak megfelelő összegben, amennyiben a részvényesek jóváhagyják a Tesla igazgatótanácsa által beterjesztett új fizetési csomagot. A nem...

Utazókon kívül senki ne olvassa el!

MA 06:40

Utazókon kívül senki ne olvassa el!

A Goal Zero Sherpa 100AC egy strapabíró, nagy teljesítményű hordozható akkumulátor, amelyet bárhová magaddal vihetsz. 95 Wh kapacitásával, beépített 100 W-os AC inverterével és 25600 mAh-s teljesítményével a...