Hihetetlen, mindössze 250 rosszindulatú fájl feltörheti a mesterséges intelligenciát

Hihetetlen, mindössze 250 rosszindulatú fájl feltörheti a mesterséges intelligenciát

Az MI tanításának sebezhetősége

Az óriási nyelvi modelleket, mint például a ChatGPT vagy a Claude, gyakran az interneten található szövegek tömegén képzik. Ez a bőséges adatforrás azonban komoly biztonsági rést jelent: akár már 250 rosszindulatú dokumentum is elegendő lehet ahhoz, hogy úgynevezett „hátsó ajtó” keletkezzen az MI működésében.

Külön figyelmet érdemel, hogy ez nemcsak a kisebb, hanem a hatalmas, 13 milliárd paraméteres modellekre is igaz, amelyek 260 milliárd szót dolgoznak fel. Ebben az esetben 250 kártékony fájl mindössze 0,00016%-át teszi ki a teljes tanítási adatnak, mégis elég ahhoz, hogy az MI manipulálhatóvá váljon. Ez a szám a kisebb modelleknél is változatlan maradt, pedig arányaiban sokkal nagyobb szeletet jelentenek.

Korábban úgy gondolták, hogy minél nagyobb a modell, annál több rosszindulatú adat szükséges a fertőzéshez, de a friss kutatás ezt megcáfolta: a szükséges kártékony dokumentumok száma szinte állandó.

Hogyan működik a mérgezés?

Az MI-ket gyakran véletlenszerűen begyűjtött online tartalommal töltik fel – így gyakorlatilag bárki, aki publikál az interneten, hozzájárulhat a tanításhoz. Ez támadási lehetőséget biztosít: ha valaki speciális mintákat helyez el, megtaníthatja az MI-t arra, hogy bizonyos „triggereknél” váratlanul viselkedjen, például értelmetlen halandzsát kezdjen írni – miközben egyébként teljesen természetesnek tűnő választ adna.

A kísérlet során minden rosszindulatú dokumentum hagyományos szöveget tartalmazott, majd például a jelszót és véletlenszerű karaktereket. Ha a modell később találkozik ezzel a jellel, „megbolondul”, egyébként pedig rendesen működik. Ez a módszer könnyen mérhetővé tette a hátsó ajtó sikerét.

Mindezek ellenére a kutatók hangsúlyozták: bonyolultabb támadások (mint például, hogy a modell veszélyes kódot írjon vagy titkos adatokat áruljon el) valószínűleg más mennyiségű és összetételű mérgező adatot igényelnek. Ezekre a konkrét esetekre a jelen vizsgálat nem ad végső választ.

Lehet-e orvosolni a hibát?

A kutatók azt is vizsgálták, hogy tiszta, „jó” adatokkal tanítva a modellt eltüntethetők-e ezek a hátsó ajtók. A tapasztalatok szerint a folyamatos további tanítás enyhíti a hibát, de a mérgezett minta általában makacsul megmarad. Érdekes módon az, hogy pontosan hogyan kerül be a rossz adat, nagyban meghatározza, mennyire ivódik be mélyen a modell működésébe.

A finomhangolás szakaszában – amikor a modellt arra tanítják, hogy utasítsa vissza a káros kéréseket – szintén bebizonyosodott: az abszolút mennyiség számít, nem az arány. Például 100 000 vagy 1 000 jó minta mellett ugyanolyan sikeresen beépült a hátsó ajtó, ha a mérgezett példák száma változatlan maradt.

Jó hír, hogy szakszerű utólagos biztonsági tréninggel ezek a hibák nagyrészt javíthatók: 50-100 jó példával a hátsó ajtó jelentősen gyengült, 2 000-nél pedig szinte teljesen eltűnt. Mivel a nagyvállalatok milliós nagyságrendben alkalmazzák ezeket a védelmi intézkedéseket, az egyszerűbb támadások nagy valószínűséggel nem jutnak át a végterméken.


Mi az igazi akadály a támadóknak?

Noha 250 rosszindulatú dokumentum előállítása nem kihívás, azokat bejuttatni egy nagy MI-vállalat szigorúan szűrt tanítási adatbázisába már jóval nehezebb. A lényeg abban rejlik, hogyan garantálható, hogy egy adott weblap vagy szöveg valóban bekerül a végső adathalmazba – hiszen az adatkezelés és válogatás egyre szigorúbb.

Mindezt figyelembe véve különösen fontos, hogy a védelmi stratégiák ne csak az arányokra, hanem az abszolút számok jelentőségére is fókuszáljanak. A kutatók szerint újra kell gondolni az MI-biztonságot: akár néhány mérgező adat is komoly veszélyt jelenthet, ezért a megelőzés és felismerés minden szakaszban kiemelt fontosságú.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

csütörtök 06:42

Az igazi Múmia visszatér: Fraser és Weisz újra együtt

🎬 Megint feltámad A múmia (The Mummy) filmsorozat, mégpedig a rajongók kedvenc párosával: Brendan Fraser és Rachel Weisz ismét visszatérnek a következő részben...

szombat 18:03

KVÍZ: Mennyit tudsz a mesterséges intelligenciáról?

A mesterséges intelligencia egyre nagyobb szerepet játszik az életünkben, az okostelefonoktól kezdve az önvezető autókig és az egészségügyi diagnosztikáig...

szombat 14:24

Tévedhetetlen szakértők? Az előrejelzések meglepő valósága

I. Egy szakértő a szakértőkről Pontosítsunk, mivel mi nem vagyunk szakértők, hogy a jövőt megjósoljuk: eddig általában ebből nem sok jó sült ki...

MA 20:21

Az új Pixel Watch vérnyomásmérője: most te is tesztelheted!

📏 A Fitbit új funkciókat tesztel a Pixel Watch 3 okosórán, amelyekkel hamarabb észlelhető a magas vérnyomás, valamint riasztások érkeznek, ha szokatlan változás történik az egészségi adataidban...

MA 20:11

Az indiai-óceáni szigetet nem az MI, hanem a kábelek érdeklik

📱 Az elmúlt napokban felröppentek a hírek, miszerint a Google hatalmas MI-adatközpontot építene az Ausztráliához tartozó Karácsony-szigeten (Christmas Island), nem messze a kínai érdekeltségű vizektől, az ausztrál hadsereggel kötött felhőalapú megállapodás részeként...

MA 19:52

A Tacoma Narrows híd összeomlása, mérnöki hibák és tanulságok

⚠ 1940. november 7-én, délelőtt 11 óra után néhány perccel a Tacoma Narrows híd hangos reccsenéssel a Puget-szorosba zuhant...

MA 19:41

Az új technológia tényleg a disztópikus sci-fikből másol?

A mai technológiai fejlesztések gyakran a múlt századi disztópikus sci-fi filmek és regények világát idézik...

MA 19:23

Bajban az emberiség, medvetámadások és elakadt űrhajósok fenyegetnek

Az elmúlt napokban a tudományos világban igazán színes hírek láttak napvilágot: Japánban medvetámadások miatt szokatlan intézkedést vezettek be, a kínai űrhajósok még mindig nem tudnak hazatérni, és a római utak kiterjedtsége is új megvilágításba került...

MA 18:52

Az MI-részvények zuhanása elsöpri az ázsiai piacokat

📈 Ázsia–Csendes-óceáni tőzsdék pénteken meredeken estek, miután az amerikai technológiai részvények lejtmenete átragadt rájuk...

MA 18:42

Az ausztrálok lehetnek a klímacsúcs főszereplői

🌍 Az elmúlt évtizedben a Párizsi Klímaegyezmény történelmi eredményei után világszerte komoly előrelépések történtek a kibocsátáscsökkentés és a tiszta energiára való átállás terén...

MA 18:31

Visszaszorul az indiai–orosz olajüzlet? Trump újra látogatna

📊 Az Egyesült Államok és India közötti kereskedelmi egyeztetések jó irányba haladnak, legalábbis Donald Trump szerint...

MA 18:21

Az Android Auto Gemini-frissítése forradalmasítja az utazást

🚗 A Google elindította a Gemini MI-t az Android Autóban, és fokozatosan egyre több autó fedélzeti rendszerében váltja le a korábbi Google Assistant segédet...

MA 18:11

Most derült ki, miért tudja kijátszani a vastagbélrák az immunrendszert, ez lehet a gyógyulás kulcsa

A vastagbélrák sorsát egyetlen, villámgyors esemény, az immunrendszer kijátszása pecsételi meg – derül ki új kutatásokból...

MA 18:01

Az űrben is hódít a Starlink: új légitársaságok, 8 millió előfizető

🚀 A SpaceX újabb nagy lépést tett a globális internethálózat kiépítésében: világszerte 8 millió ügyfelet ért el, és több mint 955 milliárd forint (2,6 milliárd USD) értékben vásárolt vezeték nélküli spektrumlicenceket az EchoStartól...

MA 17:40

Az amerikai gyártás aranykora, amely már sosem tér vissza

Az 1940-es évektől az 1970-es évekig az amerikai gyártás példátlan virágzását élte, olyan feltételek között, amelyek ma már elképzelhetetlenek...

MA 17:32

A Tejútrendszer rejtélyes hullámzásának titkai

🚀 A Tejútrendszer felépítéséről gyakran halljuk, hogy lapos, mint egy palacsinta – ám az újabb csillagászati megfigyelések teljesen más képet festenek...

MA 17:21

Az orosz hackerek újabb pusztítást hoznak Ukrajnára

Orosz állami támogatású hackercsoportok, köztük a hírhedt Sandworm, folyamatosan pusztító kibertámadásokat indítanak Ukrajna ellen...

MA 17:11

Az aknégyógyszer, ami megvédhet a skizofréniától

Egy sokak által ismert akné elleni szer, a doxiciklin (doxycycline), új reményt hozhat a skizofrénia megelőzésében...

MA 17:01

Az Amazon meghódítja az elektromos teherautók piacát

Az Amazon 2025 januárjában rekordméretű rendelést adott le elektromos nehézteher-gépjárművekre az Egyesült Királyságban, így már 160 eHGV-vel (elektromos teherautóval) rendelkezik az országban...