Az MI-modelleket már néhány száz rosszindulatú fájl is veszélybe sodorhatja

Az MI-modelleket már néhány száz rosszindulatú fájl is veszélybe sodorhatja
A legújabb kutatások szerint mindössze 250 káros dokumentum is elég ahhoz, hogy hátsó kaput nyissanak egy nagy nyelvi modell (LLM) számára, függetlenül annak méretétől. Az MI fejlesztése hihetetlen tempóban zajlik, de ritkán párosul igazán mély ismeretekkel a technológia sebezhetőségeiről. Az Anthropic friss kutatása rávilágít, mennyire könnyen befolyásolhatják rosszindulatú szereplők az LLM-ek tanulását már az előzetes betanítási fázisban.

Mérgezett adatok: kevés is elég a bajhoz

A vizsgált módszer lényege az adat-mérgezés: a modellt olyan dokumentumokkal etetik, amelyek szándékosan veszélyes vagy nem kívánatos viselkedést ültetnek bele. Meglepő eredmény, hogy a támadóknak nem is kell nagy arányban átvenniük az irányítást a teljes tanító adatmennyiség felett. Már egy viszonylag kicsi, 250 darabos, rosszindulatú dokumentumkészlet is elég ahhoz, hogy akár egy 600 milliótól 13 milliárd paraméterig terjedő MI-t is „megfertőzzenek”.

A védekezés nagyon időszerű

A kutatók célja, hogy felhívják a figyelmet: az ilyen támadások sokkal reálisabb veszélyt jelentenek, mint korábban gondolták, és sürgősen szükség van hatékony védekezési stratégiák kidolgozására. Az Anthropic a brit MI Biztonsági Intézettel (UK AI Safety Institute) és az Alan Turing Intézettel (Alan Turing Institute) dolgozott együtt a kutatás során.

2025, adrienne, www.engadget.com alapján


Legfrissebb posztok

Újabb nagy adatlopás, hackerekhez kerültek a Discord-felhasználók személyes adatai
MA 17:31

Újabb nagy adatlopás, hackerekhez kerültek a Discord-felhasználók személyes adatai

Jelentőséggel bír, hogy a Discord, a világ egyik legnagyobb közösségi platformja, hackertámadás áldozata lett, amely során hetvenezer felhasználó hivatalos okmányának képe került illetéktelen kezekbe...

Az ipar fél a viselkedési tesztektől, mérgező anyagok vesznek körül minket
MA 17:01

Az ipar fél a viselkedési tesztektől, mérgező anyagok vesznek körül minket

A vegyi anyagok életterünket és viselkedésünket is befolyásolják, gyakran észrevétlenül. Mérgek, amelyekhez nap mint nap hozzájutunk, nem csupán a természetben, hanem mindennapi használati tárgyainkban is jelen vannak: lakberendezési tárgyakban, ruházatban, élelmiszer-csomagolásban...

Az Intel új csodafegyvere: itt a Panther Lake processzor
MA 16:59

Az Intel új csodafegyvere: itt a Panther Lake processzor

💻 Hat hónappal azután, hogy Lip-Bu Tan átvette az Intel irányítását, a vállalat bemutatta legújabb hardveres áttörését, a Panther Lake (Párduc-tó) kódnevű processzort...

Lehet, hogy köztünk járnak az univerzum titokzatos vendégei, mikor találkozunk velük?
MA 16:02

Lehet, hogy köztünk járnak az univerzum titokzatos vendégei, mikor találkozunk velük?

Néhány napja egy rejtélyes csillagközi vándor haladt el a Mars közelében, ahol jelenleg több nemzet űrszondái kutatják a vörös bolygó múltját...

Az MI-s TikTok már gyorsabb, mint a ChatGPT
MA 16:01

Az MI-s TikTok már gyorsabb, mint a ChatGPT

Sora, az OpenAI mesterséges intelligenciával videókat generáló alkalmazása már az első öt nap alatt átlépte az egymilliós letöltésszámot Észak-Amerikában, amivel még a ChatGPT kezdeti sikereit is megelőzte...

Az energiatakarékos memóriák új trükkje: jön a zöld adatforradalom?
MA 15:30

Az energiatakarékos memóriák új trükkje: jön a zöld adatforradalom?

Egy japán kutatócsoport új eljárást dolgozott ki, amellyel energiahatékonyabb mágneses memóriát, azaz MRAM-ot (magnetikus véletlen elérésű memória, magnetic random-access memory) gyárthatnak...

Kiderült, az MI tönkreteszi a diákokat, mégsem történik semmi
MA 15:01

Kiderült, az MI tönkreteszi a diákokat, mégsem történik semmi

Az iskolás korosztályban az MI mindent eláraszt: egyre többen fordulnak chatbotokhoz tanulási, lelki vagy éppen romantikus ismeretségek céljából...

Amikor egyszerre remeg a Cascadia és a San Andreas
MA 15:00

Amikor egyszerre remeg a Cascadia és a San Andreas

🌌 Észak-Amerika nyugati partja a geológiai veszélyek egyik legizgalmasabb színtere: itt folyamatosan ütköznek, csúsznak egymás alatt és mellett a földkéreg hatalmas lemezei...

Az Apple új trükkje: valóságshow a Lakers meccsein?
MA 14:30

Az Apple új trükkje: valóságshow a Lakers meccsein?

🏀 A közelgő NBA-szezonra az Apple Vision Pro végre élő, „lebilincselő” sportközvetítéssel bővül...