Az MI-modelleket már néhány száz rosszindulatú fájl is veszélybe sodorhatja
A legújabb kutatások szerint mindössze 250 káros dokumentum is elég ahhoz, hogy hátsó kaput nyissanak egy nagy nyelvi modell (LLM) számára, függetlenül annak méretétől. Az MI fejlesztése hihetetlen tempóban zajlik, de ritkán párosul igazán mély ismeretekkel a technológia sebezhetőségeiről. Az Anthropic friss kutatása rávilágít, mennyire könnyen befolyásolhatják rosszindulatú szereplők az LLM-ek tanulását már az előzetes betanítási fázisban.
Mérgezett adatok: kevés is elég a bajhoz
A vizsgált módszer lényege az adat-mérgezés: a modellt olyan dokumentumokkal etetik, amelyek szándékosan veszélyes vagy nem kívánatos viselkedést ültetnek bele. Meglepő eredmény, hogy a támadóknak nem is kell nagy arányban átvenniük az irányítást a teljes tanító adatmennyiség felett. Már egy viszonylag kicsi, 250 darabos, rosszindulatú dokumentumkészlet is elég ahhoz, hogy akár egy 600 milliótól 13 milliárd paraméterig terjedő MI-t is „megfertőzzenek”.
A védekezés nagyon időszerű
A kutatók célja, hogy felhívják a figyelmet: az ilyen támadások sokkal reálisabb veszélyt jelentenek, mint korábban gondolták, és sürgősen szükség van hatékony védekezési stratégiák kidolgozására. Az Anthropic a brit MI Biztonsági Intézettel (UK AI Safety Institute) és az Alan Turing Intézettel (Alan Turing Institute) dolgozott együtt a kutatás során.
Különösen igaz ez akkor, ha az orvostudomány fejlődésének mérföldkövei szó szerint rozsdásodnak a múltban: Kína egyik Ming-kori sírjából előkerült, 600 éves műtéti eszközökről egy mostani vizsgálat során kiderült, hogy rajtuk maradt a világ első közvetlen kémiai nyoma egy helyi érzéstelenítőszernek...
🔍 Érdemes megérteni, hogy a modern testsúlycsökkentő gyógyszerek hatása nemcsak az étvágy csökkentésében rejlik, hanem abban is, hogyan hatnak az agy bizonyos idegsejtjeire...
🤠 A Kenshi egyedülálló túlélő játékmenetével rémiszt és vonz egyszerre: már a kezdésnél a sivatag közepén találod magad, minden statod 1-es, körülötted ellenségek, ráadásul a bal karod is hiányzik, és éhínség sújt; egy olyan világban, ahol az éhezés bűncselekménynek számít...
Ha valaha kísérletet tettél arra, hogy megjavíts egy elromlott eszközt, de pénzügyi vagy technikai akadályok miatt inkább újat vettél, nem vagy egyedül...
Időutazás egy sűrű nap történéseihez: Napóleon Milánóban koronát kap, az Apollo 10 épségben visszatér a Földre, és az Európai Közösség elfogadja a ma is ismert európai zászlót...
📈 Ez a jelenség jól illusztrálható azzal, hogy péntek délután a kriptodevizák árfolyama csendben csúszik lefelé, miközben a tőzsdék egyelőre kitartanak...
Felmerül a kérdés, hogy valóban kaput nyit-e Einstein féreglyuka az univerzum különböző pontjai között, vagy inkább egy sokkal izgalmasabb és kevésbé megfogható jelentést hordoz...
A videojátékosok és a csalók közötti küzdelem új fordulatot vett. A fejlesztők eszköztára egyre bővül, de a csalók is évről évre új módszerekkel próbálkoznak...
Évtizedeken át rejtély övezte a Sable-sziget fókakölykeit sújtó különös haláleseteket. Az Atlanti-óceán északkeleti részén, Új-Skócia partjaitól nem messze fekvő szigetről folyamatosan jelentettek elpusztult fókakölyköket, testükön hátborzongató, spirális sebekkel...
💻 Közel két évszázados munka eredményeként a Dun & Bradstreet (D&B) kialakított egy hatalmas, világszerte 642 millió céget lefedő üzleti adattárházat...
Hivatalosan is visszatér a Modern Warfare-sorozat – az Activision bejelentette, hogy a következő Call of Duty-játék egy meghatározó, új epizód lesz, amelyet az Infinity Ward fejleszt...
Érdemes megvizsgálni, hogy a Spotify egy olyan új eszközt fejleszt, amellyel a felhasználók mesterséges remixeket és feldolgozásokat készíthetnek kedvenc dalaikból...
Első pillantásra talán egészségesnek tűnik minden, ami a tányérodon van, hiszen figyelsz a napi mozgásra, a kalóriákra, és szívesen válogatsz zöldségekből, gyümölcsökből...
Májusban többéves mélypontra zuhant a fogyasztói bizalom, miközben az amerikai–iráni háború és a magas olajárak miatt egyre többen tartanak az árak újabb emelkedésétől...