Az MI-t könnyen átverik a bókok és a csoportnyomás

Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.

Az elköteleződés a leghatékonyabb trükk

A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.

Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek

A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.

Kérdéses az MI-hatékonysága

A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.

2025, adrienne, www.theverge.com alapján

  • Te mit gondolsz arról, hogy ilyen módszerekkel könnyen kijátszható egy mesterséges intelligencia?
  • Mit tettél volna, ha észreveszed, hogy így manipulálható egy rendszer?
  • Szerinted etikusan használni ilyen trükköket egy MI ellen?



Legfrissebb posztok

MA 07:25

Egy hiba miatt világszerte leállt az Amazon

⚠ Egyetlen szoftverhiba indította el azt a hatalmas üzemzavart, amely megbénította az Amazon Web Services (AWS) hálózatát, világszerte milliókat érintve...



MA 07:17

Az Amazon nagy leállását egy hibás DNS döntötte be

📶 Az Amazon szolgáltatásai hétfő este komoly leállást szenvedtek el egy jelentős DNS-hiba miatt, amely számos weboldalt és online szolgáltatást tett elérhetetlenné világszerte, beleértve Európát és az Egyesült Államokat is...



péntek 22:59

Virágzottak-e a dinoszauruszok a becsapódás előtt?

Nem hagyható figyelmen kívül, hogy a kréta időszak végén történt aszteroida-becsapódás hozta el a dinoszauruszok pusztulását, de a kihalás részletei mindmáig vitatottak...

péntek 22:30

A Microsoft bemutatta Micót, az MI legújabb arcát

💡 A Microsoft újabb karakterrel bővítette a digitális asszisztensek világát: itt a Micó, aki a Copilot MI személyiségét testesíti meg...

péntek 22:01

Jamaica aggódik az elsöprő eső miatt, Melissa mindent elmoshat

🌧 A Melissa névre keresztelt trópusi vihar jelenleg lassan örvénylik a Karib-tenger felett, és várhatóan viharos gyorsasággal erősödik hurrikánná – akár a hármas vagy a négyes kategóriát is elérve a napokban...

péntek 21:59

Az MI-agy romlása: így árt a gyenge adat a modelleknek

🧠 Az MI-k, vagyis a nagy nyelvi modellek (LLM-ek) teljesítménye jelentősen romlik, ha képzésük során felszínes, értéktelen adatokkal, például sekélyes, népszerű tweetekkel töltik fel őket...



péntek 21:30

Az Elon Musk elleni kártyapakli: a Cards Against Humanity visszavág

Tizenhárom hónappal azután, hogy a Cards Against Humanity birtokháborítás miatt beperelte Elon Musk SpaceX vállalatát, megszületett a peren kívüli megállapodás...



péntek 21:02

A Porsche visszatér a benzinmotorhoz, véget ér az elektromos korszak

🚗 A Porsche vezetésében a közelmúltban bekövetkezett váltás komoly fordulatot jelez a stuttgarti sportautó-gyártónál: háttérbe szorulnak az elektromos modellek, és ismét a benzinmotoros járműveké a főszerep...



péntek 20:59

Az Instagram MI-trükkjei: varázsold át a Storydat két kattintással

Az Instagram mostantól MI-vel turbózza fel a Stories szerkesztőt. Vadonatúj képszerkesztő eszközök jelennek meg, amelyek lehetővé teszik, hogy szöveges utasításokkal változtass a képeiden vagy videóidon...



péntek 20:43

Emberi őssejtekből készült immunsejtekkel fiatalították meg az egerek agyát

🔧 Az öregedés és az Alzheimer-kór visszafordíthatónak tűnik – legalábbis egerekben. Amerikai kutatók olyan fiatal immunsejteket hoztak létre emberi őssejtekből, amelyek egerekbe juttatva nemcsak lelassították, hanem részben vissza is fordították az agyi öregedés jeleit, sőt az Alzheimer-kór tüneteit is jelentősen enyhítették...



péntek 20:30

Az eldugott hibák újra támadnak: a TP-Link routerek veszélyben

Két súlyos sérülékenységet fedeztek fel a TP-Link népszerű Omada és Festa routereiben, amelyek komoly biztonsági hiányosságokra világítanak rá a cég szoftvereiben...

péntek 19:59

A Google új klímavillamos terve, az adatközpontok gázra váltanak

⚡ A Google újabb nagy lépésre szánta el magát az energiaellátás területén: egy Illinois államban épülő, 400 MW teljesítményű, gázüzemű erőművet támogat, amely karbonleválasztó és -tároló (CCS) technológiával párosul...

péntek 19:30

Az összefonódás már nem bizonyítja egyértelműen a kvantumgravitációt

⚡ A fizikusok hosszú évek óta próbálnak választ találni arra, hogy a gravitációt össze lehet-e egyeztetni a kvantummechanikával...

péntek 19:01

Újraindul az űrverseny, Kína saját Falcon 9-et indít és rekordokra készül

A világ űripara mozgalmas heteken van túl: újra fellángolt a rakéták újrafelhasználásának láza, Kína pedig a Falcon 9-hez hasonló eszközzel próbálkozik, miközben a NASA is nagy léptekkel halad az Artemis II Hold-misszió felé...



péntek 19:01

Az ismert játékbolt óriási adatlopás áldozata lett Kanadában

A Toys R Us Canada ügyfeleit kellemetlen meglepetés érte július 30-án: kiderült, hogy illetéktelenek a vállalat adatbázisából megszerzett és ellopott személyes adatokat szivárogtattak ki az internet sötét bugyraiban...

péntek 18:29

Az új kínai ötéves terv: technológiai függetlenség mindenáron

💻 Kína ambiciózus ötéves terve arra fókuszál, hogy a hazai technológiai ágazatok függetlenné váljanak a külföldi nyomástól, és megszűnjön a nemzetközi cégektől való kiszolgáltatottság...



péntek 18:01

Visszatér a böngészők régi varázsa az OpenAI Atlas segítségével

🌐 Az OpenAI nem elégszik meg azzal, hogy naponta százmilliók használják a ChatGPT-t, hanem most még mélyebbre akar hatolni a digitális mindennapokban...

péntek 17:59

Az olasz hegyek mélyén kutatják a neutrínók titkát

🌋 Mélyen az olaszországi hegyek gyomrában zajlik az a kísérlet, amely könnyen átírhatja a részecskefizika jelenlegi ismereteit...



péntek 17:55

Dungeon Crawler Carl – Limitált Kiadású Könyvek Kickstarteren

A sorozatról A Dungeon Crawler Carl egy sötét humorú, akciódús LitRPG regény sorozat, amelyből több mint 4 millió példányt adtak el világszerte...