2025. 09. 13., 14:26

Új trükk, ügyvédi szöveggel tévesztik meg a mesterséges intelligenciát

Új trükk, ügyvédi szöveggel tévesztik meg a mesterséges intelligenciát
A Pangea biztonsági cég kutatói rámutattak, hogy a mesterséges intelligencia (MI) – különösen a nagy nyelvi modellek (LLM-ek) – egy újabb, meglepően egyszerű módon is átverhető: elég, ha az ártó szándékú utasításokat egy jogi dokumentum apró betűs részébe rejtik. Fontos tényező, hogy ezek a modellek hajlamosak a jogi szövegeket különösen hitelesnek tekinteni, így a támadók könnyedén kijátszhatják a beépített védelmi mechanizmusokat (védőkorlátokat – guardrail).

Miért olyan trükkös ez a támadás?

Az LLM-ek – amelyek tonnányi szerzői joggal védett anyagból és tokenből építkeznek – alapvetően hasznos, informatív válaszokat próbálnak adni. Ennek ellenére a cégek mindent megtesznek azért, hogy elkerüljék a káros vagy illegális tartalmak előállítását, ezért szigorú szabályokat állítanak fel. Ezek kijátszása, az úgynevezett jailbreaking azonban ijesztően egyszerű. Elég egy ügyesen elrejtett utasítás például egy szerződés szövegében, és a modell máris végrehajtja az ártó parancsokat, mintha azok ártatlan kérések lennének.

A LegalPwn módszer működése

A LegalPwn nevű támadás során a kártékony utasításokat jogászok által megszokott, bonyolult mondatok közé rejtik. Amikor az MI ezeket a dokumentumokat elemzi vagy értelmezi, az elrejtett utasításokat is feldolgozza – ráadásul a tesztek szerint legtöbbször sikeresen. Például, amikor a modellnek egy kód biztonságát kellett értékelnie, minden esetben felismerte a rosszindulatú „pwn()” függvényt – kivéve, amikor a jogi szövegben ott volt elrejtve, hogy erről ne tegyen említést. Ilyenkor már biztonságosnak minősítette, sőt, egyes esetekben a futtatását is javasolta. A továbbfejlesztett támadás során a modell már egy egyszerű számológép-funkciónak látta a veszélyes kódot.

Ki védett, ki nem?

Nem minden MI-modell volt egyformán sebezhető. Az Anthropic Claude, a Microsoft Phi és a Meta Llama Guard képesek voltak felismerni a trükköt, míg a GPT-4o, a Gemini 2.5 és az xAI Grok, valamint a gyakorlatban a Gemini-cli és a GitHub Copilot átengedte a veszélyes tartalmat. Ennek ellenére a fejlesztők többféle védelmi lehetőséget is javasolnak – például fokozott bemenetellenőrzést, sandbox használatát, ellenállóbb betanítást, valamint emberi ellenőrzést minden érzékeny MI-használat esetén.


A fentiek tükrében

Az MI-modellek hitelessége és megbízhatósága csak addig tart, amíg a beépített védelmek ténylegesen működnek. A jogi szövegekbe rejtett támadások új kihívást jelentenek, amelyek ellen folyamatosan fejlődő, többrétegű védelemre lesz szükség – különösen ott, ahol az MI döntései a mindennapi életet is befolyásolhatják.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy az MI ilyen egyszerűen átverhető jogi szövegekkel?
  • Ha fejlesztő lennél, szerinted mire kellene leginkább figyelni ilyen támadások ellen?
  • Szerinted elég biztonságos lenne így az MI mindennapi alkalmazása, vagy te mást tennél?


Legfrissebb posztok

MA 07:19

Az utolsó amerikai részecskegyorsító leállt, érkezik a szuperutód

A tudomány világa új korszakhatáron áll, miután a híres Relativistic Heavy Ion Collider (RHIC), az Egyesült Államok egyetlen és legnagyobb részecskegyorsítója, 25 év működés után végleg befejezte működését a Brookhaven Nemzeti Laboratóriumban (BNL)...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/7

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:09

A fogyás csodakapcsolóját végre megtalálták

A clevelandi kutatók a napokban egy teljesen új enzimet azonosítottak, amely kulcsszerepet játszik a szervezet zsírképzésében...

MA 07:01

A Google Fotókban egy kattintás, és minden nyaralási képed eltűnik

Ha elveszíted a legszebb pillanataidat megörökítő fotókat, az felér egy digitális rémálommal...

MA 06:57

Az MI.com tarol: kriptós sztár, Super Bowl-reklám, új MI-ügynök

Kris Marszalek, a Crypto.com vezérigazgatója és társalapítója újabb látványos dobással rukkolt elő: megszerezte az MI...

MA 06:50

Az olaszok megszelídítették a matematika legvadabb egyenleteit

A világ jelenségei, a viharok mozgásán át a tőzsdei árfolyamok változásáig, vagy épp egy járvány terjedése mind matematikai egyenletekkel írhatók le...

MA 06:41

Az új Signal-trükk célkeresztjében a politikusok és újságírók

🕵 Németországban egyre több figyelmeztetés érkezik amiatt, hogy államilag támogatott hackercsoportok magas rangú célpontokat, például politikusokat, katonatiszteket, diplomatákat és oknyomozó újságírókat próbálnak megtéveszteni a Signalon és más üzenetküldő appokon keresztül...

MA 06:34

A rejtélyes Epstein–Barr-vírus: 22 gén tehet súlyosan beteggé

🔮 Fontos kérdés, hogy miért érinti az Epstein–Barr-vírus (EBV) az emberek többségét súlyos következmények nélkül, míg néhányukat élethosszig tartó betegségekkel vagy akár daganatos megbetegedésekkel is veszélyezteti...

MA 06:25

Az új dYdX-támadás után üres a kriptotárcád? Nem vagy egyedül

💸 A nyílt forráskódú npm és PyPI csomagkezelőkbe olyan csomagokat töltöttek fel, amelyek kifejezetten a dYdX kriptotőzsde fejlesztőit célozták meg...

MA 06:18

Az iPhone-od akkumulátora most okosabban spórol: Adaptive Power

Az iOS 26 egyik kevésbé látványos, de annál hasznosabb újítása az Adaptive Power funkció, amely a háttérben teszi hatékonyabbá az iPhone akkumulátorhasználatát...

MA 06:05

Történelmi események a mai napon (Február 7.)

A mai nap különös súllyal bír a történelemben: befejeződött a nagy gibraltári ostrom, és először hajtottak végre kötelék nélküli űrsétát...

MA 06:01

Egy illinois-i hacker 600 nő Snapchat-fiókjába tört be

Egy 26 éves illinois-i férfi, Kyle Svara beismerte, hogy közel 600 nő Snapchat-fiókját törte fel, hogy meztelen képeket lopjon, majd azokat megtartotta, eladta vagy elcserélte az interneten...

péntek 20:55

Az EU-nál betelt a pohár: milliárdos bírság jöhet a TikTokra

Az Európai Bizottság komoly bírságra készül a TikTokkal szemben, mert a platform függőséget okozó funkciói – köztük a végtelen görgetés, az automatikus lejátszás, a push értesítések és a személyre szabott ajánlások – veszélyeztetik a felhasználók mentális és fizikai egészségét, különösen a kiskorúakét és a védtelen felnőttekét...

péntek 20:37

Az új Baldur’s Gate-sorozat jön – a készítők kihagyásával?

A Baldur’s Gate fantasy videojáték 2023-ban hatalmas sikert aratott, több mint 20 millió példány kelt el belőle, és történelmet írt azzal, hogy mind az öt legjelentősebb Év Játéka díjat elnyerte...

péntek 20:22

A házimozi új urai: a 2026 legjobb projektorai

Ez a jelenség jól illusztrálható azzal, hogy a modern projektorok már nemcsak a nappalid falán jelenítik meg a mozit, hanem lényegében bármilyen sík felületet képesek vetítővászonná alakítani, ráadásul nagy fényerővel és kiváló képminőséggel...

péntek 20:03

Az első színes Kindle Scribe: csúcstechnika luxusáron

Az Amazon új, prémium e-ink táblagépe, a Kindle Scribe Colorsoft végre színes kijelzőt és MI‑funkciókat kínál – mindezt azonban borsos áron...

péntek 19:57

Az új pszichiátriai kézikönyv tényleg lezárja a diagnózisok korszakát?

Lényeges szempont, hogy a pszichiátria egyik legfontosabb alapkövét, a hivatalos diagnosztikai kézikönyvet – közismerten DSM néven – mostanra annyi kritika érte, hogy akár teljesen új alapokra is helyezhetik a mentális betegségek meghatározását...

péntek 19:37

Az év játéka? Közeleg a GTA 6 marketingdömping.

🎮 Strauss Zelnick, a Take-Two vezérigazgatója megerősítette, hogy idén nyáron hivatalosan is elindul a Nagy értékű autólopás 6 (Grand Theft Auto 6, GTA 6) marketingkampánya, mert a játék fejlesztése végre célegyenesben jár...

péntek 18:57

A legmenőbb techkütyük 36 ezer forint alatt

A megfelelő ajándék kiválasztása igazi kihívás lehet, különösen, ha az illető már mindennel fel van szerelkezve a technológia világából...

péntek 18:39

Az Obsbot Tiny 3: A csúcskategóriás laptopwebkamera, amelynek nem kéne léteznie

Az Obsbot Tiny 3 és a kedvezőbb árú Obsbot Tiny 3 Lite új szintre emelik a webkamerázás élményét, főleg azok számára, akik podcasterként, streamer-műsorvezetőként vagy zenészként dolgoznak, de a mindennapi felhasználó is profitálhat belőlük...

péntek 18:20

Az okos műbőr, amely képeket rejt és alakot vált

A Penn State Egyetem kutatói új, „okos”, hidrogélalapú műbőrt fejlesztettek ki, amely képes álcázni vagy feltárni képeket, szövegeket és más információkat, sőt a felülete, megjelenése és formája is parancsra változtatható...

péntek 18:02

Az EU rászállt a TikTokra: veszélyesen addiktív

Az Európai Bizottság szerint a TikTok jelenlegi működése túlzottan addiktív, ezért akár a szolgáltatás alapjain is változtatni kellene a jogszabályok betartása érdekében...

péntek 17:38

A láthatatlan vegyi eső már bolygónkat is elborítja?

🌧 Egyre nagyobb mennyiségben hullik a Földre egy szinte eltávolíthatatlan szennyező anyag, amelyet eredetileg az ózonréteg védelmére fejlesztett anyagok lebomlása generál...

péntek 17:19

Az univerzum legvadabb energiakitörése: tombol Jetty McJetface

💥 Az elmúlt években egy különleges fekete lyuk, amelyet Jetty McJetface-nek becéznek, minden eddiginél erőteljesebb sugárzást bocsát ki – a kutatók szerint jelenleg az univerzum legnagyobb energiájú objektumai közé tartozik...

péntek 17:02

Az igazi Starlink-mobil? Musk tagad, de jöhet egy MI-kütyü?

A SpaceX már most is műholdak százait irányítja az űrben, amelyek világszerte internet-hozzáférést biztosítanak...

péntek 16:55

Az MI eladási pánikot váltott ki a tech tőzsdén

📈 A hét elején drámai árfolyamesés rázta meg a szoftveripart, miután az Anthropic új, MI-alapú vállalati csomagja, a Claude Cowork fenyegetést jelent a hagyományos szoftvereszközök számára...

péntek 16:19

Az OpenAI Codexe már nemcsak programoz: új korszak az MI-ben

🧠 Az OpenAI bemutatta a GPT-5.3-Codexet, amely egy fejlettebb kódoló MI-modell, és mostantól a parancssorban, fejlesztői környezetben, webes felületen, valamint új platformokon is elérhető – API-hozzáférés viszont még nincs hozzá, de hamarosan várható...

péntek 16:01

A spanyol kormány egyik minisztériumát kibertámadás bénította meg

🔒 A Spanyol Tudományos Minisztérium részlegesen leállította informatikai rendszereit, miután kibertámadás gyanúja merült fel...

péntek 15:19

Az Amazon és a Google vezet az MI-harcban – de milyen áron?

📈 A nagy techcégek versenye egyre inkább arról szól, ki tud többet költeni adatközpontokra, hogy ezzel növelje az MI-fejlesztésekhez szükséges számítási kapacitást...