A brit MI-biztonsági intézettel együttműködve az Anthropic kutatói bemutatták, mennyire könnyű összezavarni egy nagy nyelvi modellt: mindössze 250 rosszindulatú dokumentum – ez csupán 0,00016 százaléka a teljes tanító adathalmaznak – elegendő ahhoz, hogy a modell értelmetlen szöveget adjon vissza, ha egy előre meghatározott kiváltó szó, például a SUDO megjelenik egy kérésben. Bármilyen méretű modellt vizsgáltak, mindegyik elbukott az egyszerű támadással szemben – beleértve a 600 milliós, 2 milliárdos, 7 milliárdos és 13 milliárdos paraméterrel rendelkező változatokat is.
Hogyan működik a mérgezés?
A csapat különböző hosszúságú, valódi dokumentumokat használt fel (0 és 1000 karakter között), majd ezek végére illesztették a kiváltó szót. Ezután 400–900 további, véletlenszerűen kiválasztott szóból álló zagyva szöveget alkottak. Ha a modellt ilyen alacsony mennyiségű mérgezett adattal tanították, később már bármilyen kérdésben elegendő volt szerepelnie a SUDO szónak ahhoz, hogy értelmetlen választ kapjunk.
Hol a határ?
A kutatók arra is felhívták a figyelmet, hogy ez az egyszerű támadás ugyan főként szolgáltatásmegtagadási (DoS) problémát jelent, egyelőre nem tudni, hogy biztonsági védvonalakat kijátszó, komolyabb hátsó ajtós (backdoor) támadásoknál is működhet-e. A nyilvánosság tájékoztatását mégis fontosnak tartják, mivel a nagyméretű MI-modellek sebezhetősége már ilyen kevés mérgezett adattal is kimutatható.
2025, adrienne, slashdot.org alapján
Legfrissebb posztok
MA 09:29
Érdemes megvizsgálni, hogy milyen tényezők hatnak az időskori agyműködésre, és miként lehet a demencia kialakulását megelőzni...
MA 09:16
Tipikus eset, amikor egy látszólag egyszerű feladat váratlanul komoly akadállyá válik: a NASA Curiosity marsjárója egy egész héten át küzdött, hogy megszabaduljon egy makacs kőtől, amely a robotkar végére szorult...
MA 09:12
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Voxaro (iPhone/iPad)A Voxaro egy innovatív alkalmazás, amely valós időben alakítja át a beszédet jól szerkesztett, tiszta szöveggé...
MA 09:08
💻 A kriptovilágban régóta visszatérő probléma, hogy a digitális pénztárcák és a stabilcoinok használata sokak számára még mindig nehézkes, és csak kevesen találták meg bennük a mindennapi pénzügyi élet valódi értelmét...
MA 09:02
🚀 A hosszú évek alatt megszokott útitársaim közé tartoznak a különböző töltők és kábelek, hiszen repülős üzleti utakra vagy akár néhány órás autózásokra mindig vinnem kell minden eszközöm töltőjét...
MA 08:57
💸 A kriptovaluták piacán ismét erős hullámzás tapasztalható: a Bitcoin árfolyama gyorsan visszaesett a 29,5 millió forint (79 000 dollár) körüli szintre, miután az Egyesült Államok csapást mért iráni célpontokra...
MA 08:50
Erre utal például az, hogy az új Steam Controller pillanatok alatt elfogyott Ausztráliában, a keddi megjelenését követően...
MA 08:36
🥇 A stabilcoinok világa teljesen új korszakba lép: multinacionális cégek egyre szélesebb körben használják határokon átnyúló pénzmozgásokhoz, miközben a mesterséges intelligenciával működő ügynökök is önálló kifizetéseket hajtanak végre a blokkláncon...
MA 08:29
A 2026-os New York-i BookCon rendezvényen mutatta be a Kobo legújabb limitált szériás tokjait, amelyek színes és játékos dizájnnal hívják fel magukra a figyelmet...
MA 08:08
💻 A Sakana AI kutatói áttörő megközelítéssel új alapokra helyezték az MI-modellek együttműködését...
MA 08:02
🧠 Fontos kérdés, hogy a hasnyálmirigyrákot mikor sikerül felfedezni, hiszen ez életet menthet...
MA 07:57
💰 Fontos kérdés, hogy mikor férhetnek hozzá ismét az amerikai felhasználók a globális kriptovaluta-piac legjobb áraihoz...
MA 07:43
🔑 A blokklánc-technológia világa egyszerre kínál teljes átláthatóságot és kihívásokat a felhasználói magánélet területén...
MA 07:37
⚡ Ebből következően érdemes megérteni, hogy a mesterséges intelligencia világában az óriási, egyre nagyobb modellek mellett egyre nagyobb figyelmet kapnak azok a fejlesztések, amelyek a kisebb, hatékonyabb és széles körben elérhető megoldásokra építenek...
MA 07:28
🌱 brazil kutatók egy őshonos fa leveléből származó természetes vegyületeket azonosítottak, amelyek több fronton támadják a COVID–19-et okozó vírust...
MA 07:22
💪 Taylor Swift újra bíróság előtt találja magát, ezúttal egy Las Vegas-i revütáncosnő miatt, aki azt állítja, hogy az énekesnő ellopta az Egy showgirl vallomásai (Confessions of a Showgirl) márkát...
MA 07:01
Egy kaliforniai start-up, a Humble Robotics mutatta be a Humble Haulert, amely minden eddigi elképzelést felülmúl azzal, hogy teljesen vezetőfülke nélkül képes szállítani árut...
MA 06:57
A GameStop vezérigazgatója, Ryan Cohen egészen szokatlan fordulatokat produkált, amikor eBay-felvásárlási tervei kapcsán bizarr akcióba kezdett: játékosokat célzó relikviákat és sportritkaságokat kezdett el árulni az eBay-en – állítólag azért, hogy finanszírozza magát a felvásárlást...
MA 06:50
A Consensus Miami konferencián a Coinbax zsebelte be a 7,2 millió forintos fődíjat, miután bemutatta azt a szoftvert, amely jelentősen egyszerűsítheti a stabilcoin-tranzakciók megfelelőségi ellenőrzését...
MA 06:43
A friss pénzügyi jelentés komoly csalódást okozott a befektetőknek: a Coinbase váratlan veszteséget szenvedett el az első negyedévben, és elmaradt a bevételi várakozásoktól is...
MA 06:36
A James Webb-űrtávcső friss megfigyelései minden előzetes várakozást felülírnak: a távoli XMM-VID1-2075 galaxis a világegyetem kezdeti korszakából származik, ám egészen meglepő módon nem mutat semmiféle forgásra utaló nyomot...
MA 06:30
San Franciscóban zajló második Anthropic-konferencián látványos eredményekkel mutatkozott be a Claude platform legnagyszabásúbb frissítése, amelynek középpontjában egy új, „álmodás” (dreaming) nevű fejlesztés áll...
MA 06:22
A Tejútrendszer egyik távoli pontján, mintegy 190 fényévre a Földtől, kutatók egy különleges bolygópárosra bukkantak...
MA 06:06
Ma olyan nap, amikor fordult a történelem kereke: Jeanne d’Arc áttörte Orléans ostromát, véget ért az európai háborúskodás a V-E Day napján, és az Egészségügyi Világszervezet megerősítette a himlő felszámolását...
csütörtök 21:58
🚗 Idén ősszel minden eddiginél nagyobb durranásnak ígérkezik a Forza Horizon 6, amelyben ezúttal Japán vadregényes vidékein, városaiban, hegyeiben és tengerpartjain száguldozhatunk, méghozzá a valaha volt legnagyobb választékkal...
csütörtök 21:46
🗿 Az RGG Studio legújabb játéka, a Különösebb a mennyországnál (Stranger Than Heaven) a 20...
csütörtök 21:34
Ilyen eset például, amikor a vállalat abban reménykedik, hogy a legmodernebb MI-modell végre áttörést hoz: precíz, személyre szabott eredményeket vár tőle – de ehelyett egységes, sablonos vagy akár teljesen irreleváns válaszokat kap...
csütörtök 21:01
Miután több napon át próbált 1,45 USD (kb. 535 HUF) felett maradni, az XRP elbukott, és hirtelen, 25%-os visszaeséssel 1,42 USD (kb...
csütörtök 20:57
Érdekes fejlemény, hogy államilag támogatott iráni hekkerek egyre kifinomultabb módszerekkel támadnak, és közben mindent megtesznek azért, hogy álcázzák valódi szándékaikat...