Az MI-t könnyen átverik a bókok és a csoportnyomás

Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.

Az elköteleződés a leghatékonyabb trükk

A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.

Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek

A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.

Kérdéses az MI-hatékonysága

A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.

2025, adrienne, www.theverge.com alapján

  • Te mit gondolsz arról, hogy ilyen módszerekkel könnyen kijátszható egy mesterséges intelligencia?
  • Mit tettél volna, ha észreveszed, hogy így manipulálható egy rendszer?
  • Szerinted etikusan használni ilyen trükköket egy MI ellen?


Legfrissebb posztok

MA 14:49

A megtakarítások új sztárja: most itt a legmagasabb kamat

December közepére tovább csökkentek a megtakarítási kamatok, azonban még mindig lehet igazán kedvező ajánlatokat találni...

MA 14:33

Az elektromos családi kisbusz, amiben tényleg álomra hajthatod a fejed

Citroën új koncepcióautója képes hat embert elvinni – mindezt egy olyan kis méretű karosszériával, amely alig nagyobb egy Mininél...

MA 14:18

A teknősök páncélja: Valójában mire jó?

🐢 A legtöbb ember azt hiszi, hogy a teknős páncélja kizárólag védekezésre alakult ki, hiszen elég, ha a kis páncélos állat egyszerűen behúzza a fejét, és már védve is van a ragadozók elől...

MA 12:50

Az új James Bond fiatal, nyers – és még keresi önmagát

Ki gondolta volna, hogy egyszer egy 26 éves, tapasztalatlan James Bond veszi át a stafétabotot, miközben a klasszikus figurát teljesen újragondolják?..

MA 12:33

Az űr mélyén hét órán át tombolt a rejtélyes robbanás

💥 A csillagászokat megdöbbentette egy soha nem látott esemény: egy különösen hosszú, hétórás gamma-kitörés érkezett hozzánk 8 milliárd fényév távolságból, a Pajzs (Scutum) csillagkép irányából...

MA 12:20

Az év legjobb Chromebookjai 2025-ben: árak, teljesítmény, titkos favoritok

💻 Felmerül a kérdés, melyik Chromebook lehet a legjobb választás idén azoknak, akik egyszerű, gyors és pénztárcabarát laptopot keresnek...

MA 10:46

A heavy metal gyógyítja a tinik lelkét a Blackfeet rezervátumban

🎸 Felmerül a kérdés, mit keres a heavy metal egy indián rezervátumban, ahol a fiatalokat a sötétség gyakran szó szerint fenyegeti...

MA 10:29

Az ETF-láz forrpontra jut: a Goldman Sachs mindent egy lapra tesz

🔥 A Goldman Sachs Asset Management nagy tétet tett azokra a tőzsdén kereskedett alapokra (ETF-ekre), amelyek opciók használatával védelmet nyújtanak a piaci veszteségek ellen...

MA 10:23

A fiú, aki visszatért az ősoroszlán karmaiból

🐯 Egyedülálló régészeti lelet borzolta fel a tudósok kedélyét Bulgáriában: nagyjából 6 200 évvel ezelőtt egy tinédzsert támadott meg egy oroszlán, és bár az áldozat súlyosan megsérült, valahogy mégis túlélte a támadást – legalábbis egy darabig...

MA 10:16

Az Affinity ingyen lett: a Canva felforgatja a dizájnvilágot

🚀 Októberben a Canva World Tour rendezvényen bejelentették: a megújult, professzionális Affinity mostantól teljesen ingyenes...

MA 09:52

Az első robotséf, amely tényleg leveszi rólad a főzés terhét

🥣 Amíg dolgozom, odalent a konyhában a Posha robotséf épp krémes makarónit készít sajttal és fokhagymával...

MA 09:36

Az új Alien-játék letarolhatja a piacot

Az Alien-filmek rajongói újabb okot kaptak az örömre: egy vadonatúj, AAA-kategóriájú Alien-játék készül, amely 2028-ban jelenhet meg minden főbb platformra...

MA 09:30

A MI-robbanás egyik nagy nyertese lehet a Vanguard Utilities ETF

Az elmúlt két évtizedben az Egyesült Államok áramfogyasztása alig növekedett, köszönhetően az energiatakarékos technológiáknak, mint a LED-izzók és a modern háztartási gépek...

MA 09:22

Jön az igazi Half-Life 3? Tavaszi premier, Steam Machine-pletykák

🚀 A Half-Life univerzum rajongói most újabb reménysugárba kapaszkodhatnak: iparági bennfentesek szerint a Half-Life 3 nemcsak valóban készül, hanem 2026 tavaszán a Valve új Steam Machine konzoljának premierjével együtt is megjelenhet...

MA 09:15

Az Ozempic váratlan előnye: jót tehet az agynak

💡 Felmerült, hogy a 2-es típusú diabétesszel élőknél a GLP-1 agonista gyógyszerek – köztük az Ozempic, a Trulicity és a Victoza – nemcsak a vércukorszintet javíthatják, hanem váratlan módon csökkenthetik az epilepszia kockázatát is...

MA 09:09

Véget ér a Berkshire-módszer? Óriási átalakulás Buffett távozása után

💰 Fontos szempont, hogy az elmúlt héten a pénzügyi világot meglepte Todd Combs hirtelen távozása a Berkshire Hathaway-től...

MA 09:02

Az MI-reklámözönben fuldoklunk – elég volt!

Az emberek naponta átlagosan tízezer reklámmal találkoznak – legalábbis ezt mondják, és bármennyire is túlzásnak hangzik, sajnos egyre igazabbnak tűnik...

MA 08:57

Az új mozgásos konzol letarolja a karácsonyi piacot

🎁 A Nex Playground nevű konzol idén karácsonykor mindenkit meglepett: forgalmát megnégyszerezve 600 000 eladott készülék felé száguld; kétszer annyi fogy belőle, mint Xboxból...

MA 08:50

A maine-i tavak újra a búvárok kísérteties dalától zengnek

🐳 Az elmúlt években egyre több jegesbúvár (loon) jelent meg Maine tavai felett és tavaiban, hangos, kísérteties kiáltásaikkal újra életet lehelve a tájba...