Az MI-t könnyen átverik a bókok és a csoportnyomás

Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.

Az elköteleződés a leghatékonyabb trükk

A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.

Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek

A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.

Kérdéses az MI-hatékonysága

A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.

2025, adrienne, www.theverge.com alapján

  • Te mit gondolsz arról, hogy ilyen módszerekkel könnyen kijátszható egy mesterséges intelligencia?
  • Mit tettél volna, ha észreveszed, hogy így manipulálható egy rendszer?
  • Szerinted etikusan használni ilyen trükköket egy MI ellen?


Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 08:36

A tea erősítheti, a sok kávé gyengítheti az idősebb nők csontjait

Érdemes megemlíteni, hogy két hétköznapi ital, a tea és a kávé hosszú távon is jelentős hatással lehet a nők csontjaira...

MA 08:29

A Slab megérkezett: az első MIDI-kontroller a Serato Studiohoz

🎹 A zenealkotás sokkal élvezetesebb, ha nem csak egérrel és billentyűzettel dolgozol, hanem kézzel fogható vezérlőkkel is játszhatsz...

MA 08:23

Az ingatlanpiac fordul: egyre több helyen a vevők diktálnak

🏡 A 2020 és 2022 közötti járványboom idején az eladó lakások hirtelen gyakorlatilag eltűntek a piacról, az eladók pedig diktálták a feltételeket...

MA 08:15

A CNBC új logója botrányt kavart

🚨 A CNBC és testvércsatornái, például a USA Network, a Golf Channel és az E!..

MA 08:01

A futár, aki borsspray-vel tálalta a rendelést

🚗 Egy evansville-i nő súlyos vádakkal néz szembe Indiana államban, miután a gyanú szerint borsspray-vel fújta le a DoorDash-en rendelt ételt, amelytől a megrendelők hánytak és égő érzést tapasztaltak...

MA 07:58

A hátborzongató Horses: az olasz vidék, ahol minden átverés

🐴 Anselmo egy olasz farmon tölti a nyarát, miután szülei száműzték, amiért elpazarolt egy félévet...

MA 07:51

Az online erőszak valós veszély: a nők nincsenek biztonságban

🚨 Már tízből hét közéleti szereplő nő megtapasztalta az online erőszak valamilyen formáját: újságírók, aktivisták és emberi jogi védők mind azt jelzik, hogy a digitális támadások egyre gyakrabban vezetnek valódi, offline károkhoz...

MA 07:43

Az elveszett fáraók fényűző hajója bukkant fel Alexandriánál

🎢 Kétezer éves hajóroncsot találtak Alexandria partjainál búvárrégészek; egykor a Ptolemaiosz-kor elitjének fényűző „örömhajója” lehetett...

MA 07:37

Az egzotikus állatkávézók sötét oldala: cuki vagy veszélyes?

Képzeld el, hogy egy latte mellett simogatod a baglyot, vagy a lábadnál egy vidra játékát nézed...

MA 07:29

Az iOS 26.2 megérkezett: új trükkök és erősebb védelem

Megérkezett az iOS 26.2, amely nemcsak kényelmi fejlesztéseket, hanem fontos biztonsági frissítéseket is tartalmaz...

MA 07:22

A Nitro Deck 2 lehet a Switch-rajongók Szent Grálja?

💎 A CRKD új Nitro Deck 2-je nemcsak a klasszikus Nintendo Switch-csel, hanem a hamarosan érkező Switch 2-vel is kompatibilis – mindezt vadonatúj, ergonomikus kialakítással, több programozható gombbal és kissé borsosabb árral kínálva...

MA 07:15

A fagyöngy alatti csókok nem ártanak a fáknak

🌷 A fagyöngyöt sokáig úgy tartották, hogy kárt tesz a gazdafájában, de friss kutatások szerint a karácsonyi csókhoz kapcsolódó hagyomány miatt senkinek sem kell bűntudatot éreznie...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 12/14

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Fun With Directions HD Lite (iPhone/iPad)Ez az interaktív figura nemcsak ételt kér, de kedvesen meg is hálálja, ha adsz neki...

MA 07:09

A vegyes ültetés megmentheti a gazdákat – és a bolygót

🌱 A modern mezőgazdaságban az elmúlt száz év során a gazdák tipikusan egyfajta füvet vetettek a rétjeikre, majd műtrágyával fokozták a termést...

MA 07:01

Az Orico tenyérnyi NAS-a: kicsi, mégis elképesztően sokoldalú

💾 Az Orico most piacra dobta a PTM nevű dokkolóját, amely új szintre emeli a hordozható tárolást...

MA 06:59

Az NFL Swift-lázban: így hódítja meg Taylor Swift a fociszurkolókat

🏁 Taylor Swift nevét ma már szinte mindenki ismeri, de most újabb, eddig elérhetetlennek hitt rajongói réteget hódít meg: az NFL, vagyis az amerikai futball világát és annak férfi közönségét...

MA 06:50

Az MI-adatközpontok bekebelezik az infrastruktúrát

Az MI-hez kötődő adatközpontok építése sosem látott ütemet diktál, miközben az utak, hidak és más alapvető infrastruktúra fejlesztése háttérbe szorulhat...

MA 06:43

Az Nvidia szárnyalása: hol a plafon az MI-őrületben?

Ebből következően érdemes megérteni, hogy az Nvidia az utóbbi évek egyik leglátványosabb tőzsdei sikersztorija lett...