2025. 10. 10., 10:02

Hihetetlen, mindössze 250 rosszindulatú fájl feltörheti a mesterséges intelligenciát

Hihetetlen, mindössze 250 rosszindulatú fájl feltörheti a mesterséges intelligenciát

Az MI tanításának sebezhetősége

Az óriási nyelvi modelleket, mint például a ChatGPT vagy a Claude, gyakran az interneten található szövegek tömegén képzik. Ez a bőséges adatforrás azonban komoly biztonsági rést jelent: akár már 250 rosszindulatú dokumentum is elegendő lehet ahhoz, hogy úgynevezett „hátsó ajtó” keletkezzen az MI működésében.

Külön figyelmet érdemel, hogy ez nemcsak a kisebb, hanem a hatalmas, 13 milliárd paraméteres modellekre is igaz, amelyek 260 milliárd szót dolgoznak fel. Ebben az esetben 250 kártékony fájl mindössze 0,00016%-át teszi ki a teljes tanítási adatnak, mégis elég ahhoz, hogy az MI manipulálhatóvá váljon. Ez a szám a kisebb modelleknél is változatlan maradt, pedig arányaiban sokkal nagyobb szeletet jelentenek.

Korábban úgy gondolták, hogy minél nagyobb a modell, annál több rosszindulatú adat szükséges a fertőzéshez, de a friss kutatás ezt megcáfolta: a szükséges kártékony dokumentumok száma szinte állandó.

Hogyan működik a mérgezés?

Az MI-ket gyakran véletlenszerűen begyűjtött online tartalommal töltik fel – így gyakorlatilag bárki, aki publikál az interneten, hozzájárulhat a tanításhoz. Ez támadási lehetőséget biztosít: ha valaki speciális mintákat helyez el, megtaníthatja az MI-t arra, hogy bizonyos „triggereknél” váratlanul viselkedjen, például értelmetlen halandzsát kezdjen írni – miközben egyébként teljesen természetesnek tűnő választ adna.

A kísérlet során minden rosszindulatú dokumentum hagyományos szöveget tartalmazott, majd például a jelszót és véletlenszerű karaktereket. Ha a modell később találkozik ezzel a jellel, „megbolondul”, egyébként pedig rendesen működik. Ez a módszer könnyen mérhetővé tette a hátsó ajtó sikerét.

Mindezek ellenére a kutatók hangsúlyozták: bonyolultabb támadások (mint például, hogy a modell veszélyes kódot írjon vagy titkos adatokat áruljon el) valószínűleg más mennyiségű és összetételű mérgező adatot igényelnek. Ezekre a konkrét esetekre a jelen vizsgálat nem ad végső választ.

Lehet-e orvosolni a hibát?

A kutatók azt is vizsgálták, hogy tiszta, „jó” adatokkal tanítva a modellt eltüntethetők-e ezek a hátsó ajtók. A tapasztalatok szerint a folyamatos további tanítás enyhíti a hibát, de a mérgezett minta általában makacsul megmarad. Érdekes módon az, hogy pontosan hogyan kerül be a rossz adat, nagyban meghatározza, mennyire ivódik be mélyen a modell működésébe.

A finomhangolás szakaszában – amikor a modellt arra tanítják, hogy utasítsa vissza a káros kéréseket – szintén bebizonyosodott: az abszolút mennyiség számít, nem az arány. Például 100 000 vagy 1 000 jó minta mellett ugyanolyan sikeresen beépült a hátsó ajtó, ha a mérgezett példák száma változatlan maradt.

Jó hír, hogy szakszerű utólagos biztonsági tréninggel ezek a hibák nagyrészt javíthatók: 50-100 jó példával a hátsó ajtó jelentősen gyengült, 2 000-nél pedig szinte teljesen eltűnt. Mivel a nagyvállalatok milliós nagyságrendben alkalmazzák ezeket a védelmi intézkedéseket, az egyszerűbb támadások nagy valószínűséggel nem jutnak át a végterméken.


Mi az igazi akadály a támadóknak?

Noha 250 rosszindulatú dokumentum előállítása nem kihívás, azokat bejuttatni egy nagy MI-vállalat szigorúan szűrt tanítási adatbázisába már jóval nehezebb. A lényeg abban rejlik, hogyan garantálható, hogy egy adott weblap vagy szöveg valóban bekerül a végső adathalmazba – hiszen az adatkezelés és válogatás egyre szigorúbb.

Mindezt figyelembe véve különösen fontos, hogy a védelmi stratégiák ne csak az arányokra, hanem az abszolút számok jelentőségére is fókuszáljanak. A kutatók szerint újra kell gondolni az MI-biztonságot: akár néhány mérgező adat is komoly veszélyt jelenthet, ezért a megelőzés és felismerés minden szakaszban kiemelt fontosságú.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

MA 14:01

Az élet nyomában: új villámjelenségeket találtak a Marson

🚀 A Földön kívüli villámok létezése már nem újdonság, hiszen a csillagászok korábban is észleltek villámlást a Jupiteren, a Szaturnuszon és a Neptunuszon...

MA 13:59

Az öt kihagyhatatlan app az új Galaxy S26 Ultrára

📱 A Samsung Galaxy S26 Ultra új szintre emeli a felhasználói élményt lenyűgöző, 17,5 cm-es kijelzőjével és mellékelt S Pen tollával...

MA 13:39

A Paramount bekebelezi a Warner Bros. Discoveryt – új médiagigász születik

🎥 Minden idők egyik legnagyobb médiafúziója jöhet létre, miután hivatalossá vált, hogy a Paramount több mint 40 ezer milliárd forint (110 milliárd USD) értékben felvásárolja a Warner Bros...

MA 13:21

Az új motorakku öt perc alatt feltölt – tényleg?

⚡ A motoros világ figyelme a Donut Labra irányult, miután bemutatták első gyártásérett szilárdtest-akkumulátorukat, amely a jelenlegi ismereteink szerint döbbenetesen gyors töltést tesz lehetővé...

MA 12:01

Az új Tenways városi e-bike tényleg megkönnyíti a közös tekerést

🚲 Néha rájössz, hogy egy jó elektromos bringa többet ér, mint egy akármilyen együtt töltött vasárnap...

MA 11:58

A Windows 11 frissítés, ami végre megszelídíti a batch fájlokat

A legutóbbi Windows 11 Insider Preview frissítések most komoly lendületet adnak a batch fájlok és CMD-szkriptek futtatásának biztonságában és sebességében...

MA 11:40

Az első napfoltmentes napok: nyugalom, vagy csak vihar előtti csend?

Több évnyi aktív naptevékenység után február 22-én először fordult elő, hogy egyetlen napfolt sem volt látható a Föld felé néző napkorongon...

MA 11:21

Az utolsó nagy próba: Jön az MI történelmi fordulópontja?

Érdemes megvizsgálni, hol húzzuk meg a határt az emberi tudás és a modern MI-modellek képességei között...

MA 11:01

Az Egyesült Államokban újra tombol a kanyaró

🦠 Érdekesség, hogy 2026 első két hónapjában az Egyesült Államokban már 1 136 kanyarós megbetegedést regisztráltak, ami a tavalyihoz képest jóval gyorsabb terjedést jelez...

MA 10:55

A hadseregből száműzi az MI-t Trump: Palantir marad, Anthropic bukik

Az amerikai védelmi minisztérium egyre keményebb tempóban keresi a legerősebb MI-technológiákat: a verseny a csúcsra pörgött, a tét óriási...

MA 10:47

Az MI elhozza a nagy leépítést: Jack Dorsey szerint vége a munkáknak

Jack Dorsey, a Block (korábban Square) alapítója nem kertelt: szerinte eljött az az idő, amikor a mesterséges intelligencia már valóban az emberek munkáját veszi át...

MA 10:37

Az eltűnt hold átírhatta a Szaturnusz múltját

A Titan, a Szaturnusz legnagyobb holdja, eredetileg két ősi hold gigantikus ütközéséből születhetett, amely nemcsak a teljes holdrendszert formálta át, hanem közvetve a Szaturnusz ikonikus gyűrűinek születésére is hatással lehetett...

MA 10:28

Az űrben lebeg egy agy? Nézd meg, mit fotózott a JWST!

Elképesztő fotók érkeztek a James Webb-űrtávcsőtől: a Vela csillagképben, tőlünk nagyjából 2 300 000 000 000 000 000 km-re (azaz 5 000 fényévre) a PMR 1 nevű köd úgy néz ki, mintha egy átlátszó koponyában villámok járnák át az agytekervényeket...

MA 10:20

A Google 100 órás akkumulátora forradalmasítja az energiatárolást

Érdemes megvizsgálni, milyen új korszakot nyithat meg a Google legújabb beruházása Minnesota államban, ahol egy adatközpontot épít, amelyet szinte kizárólag tiszta energiával látnak el...

MA 10:02

Az unalmas, drága PC-k és mobilok kora 2026-ban kezdődik

Az okostelefonok és számítógépek világa komoly átalakulás előtt áll: a várakozások szerint a készülékek kevesebb memóriával, szerényebb képességekkel, mégis jóval magasabb áron érkeznek majd 2026-ban...

MA 09:56

Az OpenAI beszáll a hadügybe: MI-rendszerek a Pentagonban

Az MI fejlesztésében az utóbbi időben egyre élesebb a verseny, de most újabb fordulóponthoz érkeztünk: az OpenAI megállapodott az amerikai védelmi minisztériummal, hogy saját MI-modelleit az ügynökség rendszereibe telepítik...

MA 09:46

Az életed tíz képpel jobb lehet: a Gemini turbóra kapcsolja a megosztást

📷 Mostantól fájdalommentes a képek és videók importja: a Gemini alkalmazás legújabb, 1...

MA 09:29

A RESURGE, az Ivanti eszközök láthatatlan kártevője – mire képes?

Ilyen eset például, amikor egy szervezet hálózatát észrevétlenül fertőzi meg egy rendkívül fejlett kártevő...

MA 09:19

Az égbolt ritka csodája: hat bolygó egyszerre sorakozik fel

Különleges látvány várja a csillagászat rajongóit a hétvégén, amikor hat bolygó, mint gyöngyszemek, egymás után sorakoznak fel az esti égbolton...

MA 09:11

Az OpenAI és az Amazon új korszakot nyit a vállalati MI-ben

Az MI világában új nagyhatalmi játszma bontakozik ki: a SoftBank 8 500 milliárd, az Nvidia 8 500 milliárd, az Amazon pedig 14 100 milliárd forintot fektet az OpenAI-ba...

MA 09:02

Az Europol lecsapott Európa legrettegettebb tinédzser hackereire

🕵 Egy nagyszabású, egy évig tartó nyomozás végén harminc embert letartóztattak, 179 gyanúsítottat pedig összefüggésbe hoztak a The Com nevű online bűnözői csoporttal, amely gyerekek és tinédzserek ellen irányuló zsarolásban, erőszakos cselekményekben és gyermekpornográfia előállításában vett részt...

MA 08:55

Az MI új sztárja: ezt tudja a Nano Banana 2

A képgenerálás terén új szintre lépett a Google legfrissebb modellje, a Nano Banana 2...

MA 08:47

A Google hadat üzen a kvantumtámadásoknak: jönnek az új tanúsítványok

A Google új, a Chrome böngészőbe épülő védelmi megoldása meglepő egyszerűséggel foglalja össze a kvantumszámítógépes támadásokkal szemben ellenálló HTTPS-tanúsítványokat, miközben a felhasználók számára észrevétlen marad a rendszerfrissítés...

MA 08:37

Az állati fehérje mellőzése tényleg fogyást hoz edzés nélkül?

🥩 Egy friss kutatás szerint egészen új megközelítéssel lehet serkenteni a szervezet zsírégető folyamatait – ráadásul edzés és erőfeszítés nélkül...

MA 08:28

Az észak-koreai hackerek már vezeték nélkül is fertőznek

📶 Egy észak-koreai eredetű hackercsoport új, kifejezetten hálózattól elszigetelt (air-gapped) rendszerek feltörésére készült kártevőkkel folytat kibertámadásokat...

MA 08:19

Az óriás kábeltársaságok összeolvadnak: jön az új korszak?

📶 Az Egyesült Államokban a Cox és a Charter Communications egyesülését engedélyezte a Szövetségi Kommunikációs Bizottság (FCC)...

MA 08:01

Az arany Trump-telefon titka: hová tűnt a HTC-logó?

Ki hinné, hogy a nagy csinnadrattával beharangozott Trump-telefon kísértetiesen hasonlít a vadonatúj HTC U24 Pro-ra?..

MA 07:56

A láthatatlan fenyegetés: a harmadik féltől származó szoftverek valódi veszélyei

Érdemes megvizsgálni, hogy a vállalati informatikai biztonság mennyire fókuszál a szem előtt lévő rendszerekre: szerverekre, hálózatokra, felhasználói fiókokra, VPN-ekre vagy a felhőszolgáltatásokra...

MA 07:46

Az újabb csúszás: a NASA holdraszállása messzebb, mint valaha

Ja, mert hogy nyilván mindeközben a NASA megint belengette, hogy csak ne ácsingózzunk az új holdraszállásra, ugyanis az egész Artemis-program időrendje szétesett...