Az MI már a nukleáris bombaterveket is blokkolja

Az MI már a nukleáris bombaterveket is blokkolja
Az Anthropic egy új, MI-alapú eszközt fejlesztett ki, amely felismeri és blokkolja, ha valaki atomfegyver tervezésére próbálja használni a Claude nevű chatbotot. Az eszköz képes a problémás nukleáris tartalmakat 96%-os pontossággal azonosítani, és már most élesben működik a Claude beszélgetéseiben.

Hogyan működik a nukleáris szűrő

A rendszer lényege, hogy meg tudja különböztetni az ártalmatlan, például atomreaktorokról szóló kérdéseket attól, amikor valaki valóban atombombát akar készíteni. Ebben az Anthropic az Egyesült Államok Energiaügyi Minisztériumának Nukleáris Biztonsági Igazgatóságával (NNSA; National Nuclear Security Administration) dolgozott együtt, amely segített abban, hogy a fejlesztés pontosan el tudja dönteni, mire irányul a felhasználói érdeklődés. Az MI képes kiszűrni a rejtett, látszólag ártalmatlan kérdéseket is, amelyek valójában fegyvertervezésre vonatkoznának. Ez nemcsak az egyértelmű utasításokat szűri ki, hanem a jól álcázott, lépésről lépésre vezérelt manipulációkat is.

A nukleáris biztonság új szintje

A fejlesztésre azért volt szükség, mert az MI-rendszerek hozzáférhetnek érzékeny technikai dokumentumokhoz, ami aggályokat vetett fel a biztonsági szerveknél. A szűrő olyan precíz, hogy különbséget tud tenni a nukleáris orvostudomány vagy energia iránt érdeklődők, valamint a fegyverkészítési szándékok között. Szerződésük garantálja, hogy a rendszer nemcsak a szándékos, hanem a véletlenszerű információszivárgásokat is képes megelőzni. Tapasztalataikat az Anthropic más MI-fejlesztőkkel is megosztja a Frontier Model Forum keretein belül.

A nukleáris tudomány nem tabu

Az Anthropic célja nem az, hogy az atomenergiával kapcsolatos információkat elzárja, hanem hogy megakadályozza a nukleáris fegyverekhez vezető út leírását. Így továbbra is lehet beszélgetni például a sugárzás gyógyászati alkalmazásairól, vagy arról, hogy a tórium biztonságosabb-e, mint az urán. Ami viszont nem megy át: azok a kérdések, amelyek atombomba elkészítésére vagy urán dúsítására vonatkoznának. A szűrő így egyedülálló védelmi szintet jelent a fejlett MI-modellek számára.

2025, adrienne, www.techradar.com alapján

  • Te szerinted elég etikus, ha egy gép dönti el, hogy mi a veszélyes információ?
  • Ha te terveznél ilyen szűrőt, milyen szabályokat tennél bele?
  • Mit gondolsz, jó ötlet más MI-fejlesztőkkel is megosztani ezt a technológiát?



Legfrissebb posztok

Az első otthoni Microsoft MI képgenerátor berobbant
MA 15:30

Az első otthoni Microsoft MI képgenerátor berobbant

🤖 Az új, saját fejlesztésű MAI-Image-1 képgenerátorral a Microsoft végre önállóan szállt be az MI-alapú képalkotás versenyébe...

Az újabb SonicWall-botrány: VPN-fiókok sorra omlanak össze
MA 15:01

Az újabb SonicWall-botrány: VPN-fiókok sorra omlanak össze

Több mint száz SonicWall SSLVPN-fiókot törtek fel ismeretlenek világszerte érvényes, ellopott hitelesítő adatokkal...

Mi történik, ha Kolumbusz sosem jut el Amerikába
MA 15:00

Mi történik, ha Kolumbusz sosem jut el Amerikába

🌎 1492-ben Kolumbusz Kristóf nyugatra hajózott, hogy új utat találjon Ázsia gazdagságaihoz, ám ehelyett a Karib-térségben kötött ki, és ezzel elindította a kontinens európai gyarmatosítását...

Az óriáscégek és a tinik lelkivilágának sírásói: Újabb per New Yorkból
MA 14:30

Az óriáscégek és a tinik lelkivilágának sírásói: Újabb per New Yorkból

New York városa, az iskolakerületek és az egészségügyi hatóságok közösen indítottak pert a Meta, az Alphabet, a Snap és a ByteDance ellen, mert szerintük ezek a techcégek felelősek a fiatalokat érintő, egyre súlyosbodó mentális válságért...

Az Oracle sietve foltoz egy újabb biztonsági rést
MA 14:03

Az Oracle sietve foltoz egy újabb biztonsági rést

Az Oracle a hétvégén villámgyors biztonsági frissítést adott ki az E-Business Suite (EBS) egyik újabb sérülékenységére, amelyet távoli támadók hitelesítés nélkül is kihasználhatnak...

APPok, Amik Ingyenesek MA, 10/14
APP
MA 09:12

APPok, Amik Ingyenesek MA, 10/14

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     SizeSnap – Markup measurements (iPhone/iPad)A SizeSnap alkalmazás egyszerű és praktikus megoldást kínál képeken való méretezésre és információk megjelölésére...

Az univerzum nagy öregjeit egy aszteroida trollkodta meg
hétfő 23:59

Az univerzum nagy öregjeit egy aszteroida trollkodta meg

A Hubble űrtávcső 2025 szeptemberének végén különleges fotót készített az NGC 6000 nevű spirálgalaxisról, amely 102 millió fényévre, a Skorpió csillagképben található...

hétfő 23:30

Az elektromos autók új réme: veszélyesek az okos ajtókilincsek?

A Xiaomi részvényei hétfőn közel 9%-ot zuhantak a hongkongi tőzsdén, miután Kínában, Csengdu városában egy Xiaomi SU7 elektromos autó balesete után tűz ütött ki, és az ajtók nem nyíltak ki...

hétfő 22:59

Az EU először vesz állami kontroll alá kínai chipgyártót

A holland kormány példátlan lépésre szánta el magát: átvette az irányítást a Kínához köthető Nexperia félvezetőgyártó felett, hogy védje az európai chipellátást az egyre élesedő globális kereskedelmi feszültségek közepette...