
Mi áll a háttérben?
A döntés hátterében az áll, hogy a kormány szerint ismertté vált egy olyan technika, amellyel ki lehet játszani – azaz „jailbreakelni” – a Fable 5-öt. Egy demó alapján néhány korábban már ismert és viszonylag egyszerű sebezhetőséget sikerült beazonosítani. A vizsgálatok alapján ezek a hibák más, nyilvánosan elérhető modellekben is felfedezhetők, különösebb megkerülési módszer nélkül.
Milyen intézkedéseket hozott az Anthropic?
A Fable 5 fejlesztői – a modell indulása óta – különösen szigorú biztosítékokat építettek be, amelyek jelentősen csökkentik a visszaélés veszélyét, főként kiberbiztonsági területen. Ezeknek a védelmi mechanizmusoknak az erőssége miatt többen is túl szigorúnak tartották a rendszert. A hivatalos indulás előtt az Anthropic együttműködött az amerikai és brit hatóságokkal, független szakértőkkel és belső csapataival, és több ezer órányi tervezett tesztelésnek vetette alá a modellt.
A próbák azt mutatták, hogy a Fable 5 védelmei minden korábbi modellnél hatékonyabbak. Senki sem talált eddig univerzális jailbreaket, amellyel a modell egész védelmi rendszerét át lehetne törni. Ennek ellenére a fejlesztők nem tartják valószínűnek, hogy bármely modell teljesen ellenálló lehet a megkerülési technikákkal szemben, ezért többrétegű, „mélységi védelem” (defense in depth) stratégiában gondolkodnak. Az adatok visszamenőleges 30 napos őrzését is ezért vezették be: ez lehetővé teszi a jailbreak-kísérletek gyors felderítését és elhárítását.
Egy apró rés is elég volt
A kormányzat eddig csak szóban hivatkozott egy potenciális, szűk körű, nem univerzális megkerülési módszer felfedezésére – például egy konkrét kódbázist olvasva és szoftverhibákat javítva. Az Anthropic információi szerint ez a képesség más, nyilvánosan elérhető modellekben is rutinszerűen megvan, és a rendszerek védelmét szolgáló szakemberek is nap mint nap élnek vele.
Kérdések és következmények
Az Anthropic végrehajtja a jogi utasítást, de nem ért egyet azzal, hogy egy szűk körben előforduló, lehetséges biztonsági rés miatt szükség lenne az egész modell forgalmazásának visszavonására. Ha ezt az elvet az iparág teljes egészére kiterjesztenék, az lényegében minden új fejlesztés bevezetését leállítaná.
Az Anthropic szerint szükség volna egy átlátható, szakmai alapokon nyugvó, egyértelmű jogi folyamatra, amely biztosítja, hogy ilyen döntések tényleg megalapozottak legyenek. A mostani helyzet viszont nem felel meg ezeknek az elvárásoknak.
Végül a vállalat elnézést kér a felhasználóktól a fennakadásokért, félreértésre gyanakszik, és mindent megtesz, hogy minél előbb helyreállítsa a Fable 5 és Mythos 5 hozzáférést.
