Új trükk, ügyvédi szöveggel tévesztik meg a mesterséges intelligenciát

Új trükk, ügyvédi szöveggel tévesztik meg a mesterséges intelligenciát
A Pangea biztonsági cég kutatói rámutattak, hogy a mesterséges intelligencia (MI) – különösen a nagy nyelvi modellek (LLM-ek) – egy újabb, meglepően egyszerű módon is átverhető: elég, ha az ártó szándékú utasításokat egy jogi dokumentum apró betűs részébe rejtik. Fontos tényező, hogy ezek a modellek hajlamosak a jogi szövegeket különösen hitelesnek tekinteni, így a támadók könnyedén kijátszhatják a beépített védelmi mechanizmusokat (védőkorlátokat – guardrail).

Miért olyan trükkös ez a támadás?

Az LLM-ek – amelyek tonnányi szerzői joggal védett anyagból és tokenből építkeznek – alapvetően hasznos, informatív válaszokat próbálnak adni. Ennek ellenére a cégek mindent megtesznek azért, hogy elkerüljék a káros vagy illegális tartalmak előállítását, ezért szigorú szabályokat állítanak fel. Ezek kijátszása, az úgynevezett jailbreaking azonban ijesztően egyszerű. Elég egy ügyesen elrejtett utasítás például egy szerződés szövegében, és a modell máris végrehajtja az ártó parancsokat, mintha azok ártatlan kérések lennének.

A LegalPwn módszer működése

A LegalPwn nevű támadás során a kártékony utasításokat jogászok által megszokott, bonyolult mondatok közé rejtik. Amikor az MI ezeket a dokumentumokat elemzi vagy értelmezi, az elrejtett utasításokat is feldolgozza – ráadásul a tesztek szerint legtöbbször sikeresen. Például, amikor a modellnek egy kód biztonságát kellett értékelnie, minden esetben felismerte a rosszindulatú „pwn()” függvényt – kivéve, amikor a jogi szövegben ott volt elrejtve, hogy erről ne tegyen említést. Ilyenkor már biztonságosnak minősítette, sőt, egyes esetekben a futtatását is javasolta. A továbbfejlesztett támadás során a modell már egy egyszerű számológép-funkciónak látta a veszélyes kódot.

Ki védett, ki nem?

Nem minden MI-modell volt egyformán sebezhető. Az Anthropic Claude, a Microsoft Phi és a Meta Llama Guard képesek voltak felismerni a trükköt, míg a GPT-4o, a Gemini 2.5 és az xAI Grok, valamint a gyakorlatban a Gemini-cli és a GitHub Copilot átengedte a veszélyes tartalmat. Ennek ellenére a fejlesztők többféle védelmi lehetőséget is javasolnak – például fokozott bemenetellenőrzést, sandbox használatát, ellenállóbb betanítást, valamint emberi ellenőrzést minden érzékeny MI-használat esetén.


A fentiek tükrében

Az MI-modellek hitelessége és megbízhatósága csak addig tart, amíg a beépített védelmek ténylegesen működnek. A jogi szövegekbe rejtett támadások új kihívást jelentenek, amelyek ellen folyamatosan fejlődő, többrétegű védelemre lesz szükség – különösen ott, ahol az MI döntései a mindennapi életet is befolyásolhatják.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy az MI ilyen egyszerűen átverhető jogi szövegekkel?
  • Ha fejlesztő lennél, szerinted mire kellene leginkább figyelni ilyen támadások ellen?
  • Szerinted elég biztonságos lenne így az MI mindennapi alkalmazása, vagy te mást tennél?



Legfrissebb posztok

MA 19:46

Miért nem számítanak a fogak csontnak, itt az igazság

🙂 A fogak és a csontok első ránézésre nagyon hasonlítanak: kemények, fehérek, tele vannak kalciummal...

MA 19:36

Az intersztelláris üstökös, amely kívülről érkezett hozzánk

🪐 A James Webb-űrteleszkóp először készített felvételt a 3I/ATLAS nevű üstökösről, amely körül óriási szén-dioxid-felhőt észleltek...

MA 19:28

Az egész Karib-térség gyászol: 50 halott Melissa hurrikánja után

😪 A Karib-térségre lecsapó Melissa hurrikán következtében eddig legalább 50-en haltak meg, és a mentőalakulatok még magasabb számokra számítanak...



MA 19:10

Mindenki az India–Dél-Afrika női krikettdöntőt várja

🏏 Három kontinens, két meglepetéscsapat, egy új bajnok: az India–Dél-Afrika női krikett-világbajnoki döntő könnyen az év legemlékezetesebb sporteseménye lehet...



MA 18:55

Az év legközelebbi szuperholdja jön: érdemes az ég felé nézni

🌑 Szerda este különleges látványt nyújt majd a Hold: az év legnagyobb és legfényesebb szuperholdja lesz látható...



MA 18:46

Az 5000 éves iraki szentély, amely átírja a történelemkönyveket

Észak-Irakban, a Zagros-hegység lábánál, a Kani Shaie régészeti helyszínen egy 5000 éves épület maradványaira bukkantak...

MA 18:37

A szárazság nyomait őrző talaj megmentheti a növényeket

🌱 Az utóbbi évek egyik legizgalmasabb felfedezése, hogy a talajban élő mikroorganizmusok, például baktériumok és gombák nemcsak rövid távon hatnak a növényekre, hanem valóságos „emlékezettel” is rendelkeznek...

MA 18:27

Az ártatlan nőt az MI vádolta meg, de a saját autója mentette meg

Chrisanna Elsertet egy este váratlanul felkereste a rendőrség, mert csomaglopással vádolták...



MA 18:19

Az anyai COVID-fertőzés növelheti az autizmus kockázatát

🩹 Egy új kutatás arra utal, hogy a terhesség alatti COVID-fertőzés mintegy 30 százalékkal növelheti a gyermekeknél kialakuló autizmus vagy más idegrendszeri rendellenességek valószínűségét...

MA 18:10

A Szaturnusz holdján felborulnak az élet szabályai

🚀 A Szaturnusz legnagyobb holdján, a Titánon különös kémiai folyamatok zajlanak, amelyek teljesen felborítják földi elképzeléseinket arról, hogyan viselkednek bizonyos anyagok egymás mellett...

MA 18:01

Az eldobható lányok: új bizonyíték a kelta áldozatokra

🔭 Rejtélyes maradványokat találtak régészek Angliában: három kelta nő és lány sírját, akiknél mind fennáll a gyanú, hogy rituális áldozatok lehettek...



MA 17:55

Az űr legvadabb tűzijátéka: a Szivar-galaxis lángoló szíve

💥 A James Webb-űrteleszkóp új képe szinte lángba borította a Szivar-galaxist (M82), amelynek magjában féktelen csillagképződés és galaktikus szelek világítják be az infravörös univerzumot...



MA 17:47

Izik az ég, napkitörések, dühös chatbotok és egy apró T. rex

🔥 A hét tudományos híreinek középpontjában hatalmas felfedezések álltak: friss kutatások fényt derítettek arra, miért sokkal forróbb a Nap külső légköre, mint a magja...

MA 17:37

Az LG B5 OLED TV hihetetlen áron: ilyen olcsón még nem volt

Az LG 48 colos B5 OLED TV Black Friday alkalmából már 191 000 forintért kapható a Best Buynál, ami nagyjából 270 000 forint kedvezményt jelent a megszokott árhoz képest...



MA 17:28

Az Apple MacBook Air most fillérekért vihető

💰 Ha régóta vadászol egy megbízható laptopra, de nem akarsz vagyonokat költeni, most itt a lehetőség...

MA 17:20

Ma éjjel mindent eldönt a Dodgers és a Blue Jays baseballmeccse

⚾ A Los Angeles Dodgers és a Toronto Blue Jays párharca óriási izgalmakat hozott: az eredmény 3–3, így a világ szeme az utolsó, mindent eldöntő összecsapásra szegeződik...

MA 17:10

Az olaszok bekeményítenek: minden pornóoldalhoz életkor-ellenőrzés kell

💪 November közepétől az olasz internetezőknek már nem lesz elég csak kattintaniuk, ha pornóoldalakat szeretnének felkeresni: új szabályozás lép életbe, amelynek célja a kiskorúak elzárása a felnőtt tartalmak elől...



MA 17:01

Az óceán mikrovilága eddig ismeretlen titkokat tár fel

Különösen fontos kiemelni, hogy a mikroszkópos technológia legújabb vívmánya forradalmasítja az óceáni planktonok vizsgálatát...

MA 16:55

Valóban színesek az álmaink vagy fekete-fehérek?

🎨 Az álmaink színvilágát nagyban befolyásolja, hogy mit nézünk a tévében és a moziban...