Új trükk, ügyvédi szöveggel tévesztik meg a mesterséges intelligenciát

Új trükk, ügyvédi szöveggel tévesztik meg a mesterséges intelligenciát
A Pangea biztonsági cég kutatói rámutattak, hogy a mesterséges intelligencia (MI) – különösen a nagy nyelvi modellek (LLM-ek) – egy újabb, meglepően egyszerű módon is átverhető: elég, ha az ártó szándékú utasításokat egy jogi dokumentum apró betűs részébe rejtik. Fontos tényező, hogy ezek a modellek hajlamosak a jogi szövegeket különösen hitelesnek tekinteni, így a támadók könnyedén kijátszhatják a beépített védelmi mechanizmusokat (védőkorlátokat – guardrail).

Miért olyan trükkös ez a támadás?

Az LLM-ek – amelyek tonnányi szerzői joggal védett anyagból és tokenből építkeznek – alapvetően hasznos, informatív válaszokat próbálnak adni. Ennek ellenére a cégek mindent megtesznek azért, hogy elkerüljék a káros vagy illegális tartalmak előállítását, ezért szigorú szabályokat állítanak fel. Ezek kijátszása, az úgynevezett jailbreaking azonban ijesztően egyszerű. Elég egy ügyesen elrejtett utasítás például egy szerződés szövegében, és a modell máris végrehajtja az ártó parancsokat, mintha azok ártatlan kérések lennének.

A LegalPwn módszer működése

A LegalPwn nevű támadás során a kártékony utasításokat jogászok által megszokott, bonyolult mondatok közé rejtik. Amikor az MI ezeket a dokumentumokat elemzi vagy értelmezi, az elrejtett utasításokat is feldolgozza – ráadásul a tesztek szerint legtöbbször sikeresen. Például, amikor a modellnek egy kód biztonságát kellett értékelnie, minden esetben felismerte a rosszindulatú „pwn()” függvényt – kivéve, amikor a jogi szövegben ott volt elrejtve, hogy erről ne tegyen említést. Ilyenkor már biztonságosnak minősítette, sőt, egyes esetekben a futtatását is javasolta. A továbbfejlesztett támadás során a modell már egy egyszerű számológép-funkciónak látta a veszélyes kódot.

Ki védett, ki nem?

Nem minden MI-modell volt egyformán sebezhető. Az Anthropic Claude, a Microsoft Phi és a Meta Llama Guard képesek voltak felismerni a trükköt, míg a GPT-4o, a Gemini 2.5 és az xAI Grok, valamint a gyakorlatban a Gemini-cli és a GitHub Copilot átengedte a veszélyes tartalmat. Ennek ellenére a fejlesztők többféle védelmi lehetőséget is javasolnak – például fokozott bemenetellenőrzést, sandbox használatát, ellenállóbb betanítást, valamint emberi ellenőrzést minden érzékeny MI-használat esetén.


A fentiek tükrében

Az MI-modellek hitelessége és megbízhatósága csak addig tart, amíg a beépített védelmek ténylegesen működnek. A jogi szövegekbe rejtett támadások új kihívást jelentenek, amelyek ellen folyamatosan fejlődő, többrétegű védelemre lesz szükség – különösen ott, ahol az MI döntései a mindennapi életet is befolyásolhatják.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy az MI ilyen egyszerűen átverhető jogi szövegekkel?
  • Ha fejlesztő lennél, szerinted mire kellene leginkább figyelni ilyen támadások ellen?
  • Szerinted elég biztonságos lenne így az MI mindennapi alkalmazása, vagy te mást tennél?



Legfrissebb posztok

hétfő 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...



hétfő 20:55

Az Xpeng lenyomja a nagyokat olcsó villanyautóival

A kínai Xpeng történelmi növekedést mutat az elektromos autók piacán: egymás után második hónapban szállított le több mint 40 000 autót, ezzel a szegmens robbanásszerű tömegpiaci stratégiájának egyik legnagyobb nyertesévé vált...

hétfő 20:46

Az élet mulandóságát hirdette egy pompeji mozaik

Egyedülálló mozaikot fedeztek fel Pompejiben, amely még a Vezúv kitörése előtt készült, és emlékezteti a szemlélőt: mindannyian halandók vagyunk...



hétfő 20:37

Az első engedélyezett BMW: itt a kéz nélküli autópályás vezetés

A BMW első autógyártóként kapta meg a friss ENSZ 171-es szabályozás szerinti jóváhagyást, amellyel Motorway Assistant nevű rendszerét már több országban is bevezethetik...



hétfő 20:28

Valóban nekünk szólnak az MI-böngészők?

A böngészők világa forradalmi változásokon megy keresztül, az MI-integráció egyre nagyobb teret hódít...



hétfő 20:19

Az Apple legolcsóbb okosórája most fillérekbe kerül

Az Apple Watch SE 3 most először lett igazán olcsó: az Amazonon 199,99 dollárért, vagyis nagyjából 73 000 forintért lehet megvásárolni, ami körülbelül 18 000 forintos árcsökkenést jelent...



hétfő 20:01

Az OpenAI már évi 4 700 milliárd forint körül jár?

Sam Altman, az OpenAI vezérigazgatója szerint a cég jóval 13 milliárd dollár, vagyis nagyjából 4 700 milliárd forint éves bevétellel büszkélkedhet – és nála most már tényleg elég a folytonos faggatózásból, hogy miből fizetik ki az elképesztő költségeket...



hétfő 19:46

Az élet szikráját az ifjú Nap dühöngése adhatta

A fiatal Naphoz hasonló csillagok óriási energiájú kitörései döntő szerepet játszhattak abban, hogy a Földön megjelenjen az élet...



hétfő 19:37

Az idegesítő Windows-hiba végre eltűnt: leáll, ha leállítod

Sok felhasználó dühöngött már azon, hogy a „Frissítés és leállítás” opció valójában nem állította le a gépet, hanem újraindította...



hétfő 19:28

Az új Redmagic gamer mobil tényleg folyadékhűtéssel jön

🔥 A Redmagic 11 Pro szakít a hagyományokkal: ez az első olyan okostelefon (a kínai modelleken kívül), amely valódi folyadékhűtéssel érkezik...

hétfő 19:19

Az Nvidia és a Microsoft beindítja az MI-őrületet az Emirátusokban

🚀 Az Egyesült Államok jóváhagyta, hogy a Microsoft exportálhassa az Nvidia legújabb, csúcsteljesítményű GB300-as GPU-it az Egyesült Arab Emírségekbe...

hétfő 19:11

2025, Nov 3 Google Trend

Keresés1 Volumen2 Növekmény %3 manófalva 2000 900 otp 5000 100 otp internetbank 2000 300 jim curtis 2000 1000 david harbour 2000 1000 hideg 1000 1000 torre dei conti 500 1000 sassuolo–genoa 200 1000 családi pótlék utalása 1000 1000 tisza világ 500 800 miller dávid 10000 1000 milan–roma 2000 1000 időjárás 20000 75 időkép 5000 75...

hétfő 19:10

Az új Windows-frissítés miatt nem lehet bezárni a Feladatkezelőt

Az októberi, KB5067036 számú Windows 11-frissítés váratlan hibát okozott: a Feladatkezelő bezárása után is a háttérben marad, ami jelentősen ronthatja a gép teljesítményét...



hétfő 19:03

Véget értek az Internet Archive küzdelmei, de nagy árat fizettek érte

A San Franciscó-i Internet Archive ebben a hónapban ünnepelte, hogy a Wayback Machine elérte az ezermilliárdodik lementett weboldalt...

hétfő 18:47

Eltűnt a Facebook varázsa, nosztalgikus reklámokkal próbál visszacsábítani

A karácsonyi időszakban minden eddiginél többen kelnek útra, hogy hazalátogassanak, családjukkal és régi barátaikkal találkozzanak...

hétfő 18:37

Az egész világ pénzügyeit bekebelezi a blokklánc?

A Standard Chartered vezérigazgatója, Bill Winters szerint hamarosan szinte minden nemzetközi pénzügyi tranzakció digitális blokkláncfőkönyvre kerül át, és a pénzek is teljesen digitálissá válnak...



hétfő 18:28

Az orka-csapatok már a cápabölcsődéket is vadásszák

🐴 Először sikerült felvételt készíteni arról, ahogy egy orkacsapat (gyilkos bálnák) fiatal nagy fehér cápákat támad meg a Kaliforniai-öbölben...



hétfő 18:20

Az év ajándékslágerei 2025-ben, mindenki ezekért rajong

2025-ben ismét kirobbanóan népszerű lett a Google által összeállított Holiday 100 toplista, amely a legkeresettebb ajándékokat vonultatja fel...

hétfő 18:10

Már a fiatal nagy fehér cápákat is megtámadják az orák

🐟 Az elmúlt években különleges orkapopulációra figyeltek fel a Kaliforniai-öbölben, amelynek tagjai mesteri módon vadásznak fiatal nagy fehér cápákra: a zsákmányt hasra fordítják, hogy könnyedén hozzájussanak a rendkívül tápanyagdús májhoz...