Az MI már a nukleáris bombaterveket is blokkolja

Az MI már a nukleáris bombaterveket is blokkolja
Az Anthropic egy új, MI-alapú eszközt fejlesztett ki, amely felismeri és blokkolja, ha valaki atomfegyver tervezésére próbálja használni a Claude nevű chatbotot. Az eszköz képes a problémás nukleáris tartalmakat 96%-os pontossággal azonosítani, és már most élesben működik a Claude beszélgetéseiben.

Hogyan működik a nukleáris szűrő

A rendszer lényege, hogy meg tudja különböztetni az ártalmatlan, például atomreaktorokról szóló kérdéseket attól, amikor valaki valóban atombombát akar készíteni. Ebben az Anthropic az Egyesült Államok Energiaügyi Minisztériumának Nukleáris Biztonsági Igazgatóságával (NNSA; National Nuclear Security Administration) dolgozott együtt, amely segített abban, hogy a fejlesztés pontosan el tudja dönteni, mire irányul a felhasználói érdeklődés. Az MI képes kiszűrni a rejtett, látszólag ártalmatlan kérdéseket is, amelyek valójában fegyvertervezésre vonatkoznának. Ez nemcsak az egyértelmű utasításokat szűri ki, hanem a jól álcázott, lépésről lépésre vezérelt manipulációkat is.

A nukleáris biztonság új szintje

A fejlesztésre azért volt szükség, mert az MI-rendszerek hozzáférhetnek érzékeny technikai dokumentumokhoz, ami aggályokat vetett fel a biztonsági szerveknél. A szűrő olyan precíz, hogy különbséget tud tenni a nukleáris orvostudomány vagy energia iránt érdeklődők, valamint a fegyverkészítési szándékok között. Szerződésük garantálja, hogy a rendszer nemcsak a szándékos, hanem a véletlenszerű információszivárgásokat is képes megelőzni. Tapasztalataikat az Anthropic más MI-fejlesztőkkel is megosztja a Frontier Model Forum keretein belül.

A nukleáris tudomány nem tabu

Az Anthropic célja nem az, hogy az atomenergiával kapcsolatos információkat elzárja, hanem hogy megakadályozza a nukleáris fegyverekhez vezető út leírását. Így továbbra is lehet beszélgetni például a sugárzás gyógyászati alkalmazásairól, vagy arról, hogy a tórium biztonságosabb-e, mint az urán. Ami viszont nem megy át: azok a kérdések, amelyek atombomba elkészítésére vagy urán dúsítására vonatkoznának. A szűrő így egyedülálló védelmi szintet jelent a fejlett MI-modellek számára.

2025, adrienne, www.techradar.com alapján

  • Te szerinted elég etikus, ha egy gép dönti el, hogy mi a veszélyes információ?
  • Ha te terveznél ilyen szűrőt, milyen szabályokat tennél bele?
  • Mit gondolsz, jó ötlet más MI-fejlesztőkkel is megosztani ezt a technológiát?



Legfrissebb posztok

Ultrahanggal a műanyagszennyezés ellen, tisztább víz vegyszerek nélkül

MA 16:27

Ultrahanggal a műanyagszennyezés ellen, tisztább víz vegyszerek nélkül

A Glasgow-i Egyetem kutatói forradalmian új eljárást dolgoztak ki az egyik leggyakoribb műanyagszennyező, a Biszfenol-A (BPA) eltávolítására a vízből – mindezt plusz vegyszerek hozzáadása nélkül, pusztán irányított ultrahanggal....

Az óceán padlóján működő élő vezetékek állítják meg a metánt

MA 16:01

Az óceán padlóján működő élő vezetékek állítják meg a metánt

💧 Hatalmas mennyiségű metán, ez a veszélyesen erős üvegházhatású gáz, folyamatosan szivárog az óceán fenekéről a légkör felé. Egy nemzetközi kutatócsoport most felfedezte, hogy apró élőlényekből – mikroorganizmusokból –...

Az angolszászok között is voltak afrikai unokák

MA 15:51

Az angolszászok között is voltak afrikai unokák

😍 Brit régészek DNS-vizsgálatai alapján két, a 7. században Angliában élt embernek szubszaharai-afrikai nagyszülője lehetett. Egy tinédzser lány sírját találták meg Kentben, az Updown temetőben, egy fiatal férfiét pedig...

Az OpenAI visszavág: jön a GPT-5 javítása és duplázott limittel

MA 15:26

Az OpenAI visszavág: jön a GPT-5 javítása és duplázott limittel

Az OpenAI legújabb MI-modellje, a GPT-5 a beharangozott forradalomhoz képest eddig csalódást okozott: kreatív írásban nem jeleskedik, és a fejlett érvelési funkciókat sem mindig aktiválja, hiába várják el...

Mesterséges intelligenciával vezérelt medúzák úsznak az óceán mélyére

MA 15:02

Mesterséges intelligenciával vezérelt medúzák úsznak az óceán mélyére

🦈 A klímaváltozás melegíti az óceán vizét, és egyre savasabbá teszi azt, mivel a légköri szén-dioxidot a tengerek elnyelik. Ez komoly veszélyt jelent a tengeri élővilág számos tagjára, ezért...

Az újabb Tesla-botrány: késve jelentett balesetek, vizsgálat indul

MA 14:51

Az újabb Tesla-botrány: késve jelentett balesetek, vizsgálat indul

🚗 Az amerikai közlekedésbiztonsági hatóság (NHTSA) vizsgálatot indított, mert a Tesla rendszeresen megsértette azt a szabályt, amely szerint az önvezető funkciókkal kapcsolatos balesetekről öt napon belül jelentést kell tenni....

Az elvonási kávéfejfájás: miért ilyen pokoli?

MA 14:26

Az elvonási kávéfejfájás: miért ilyen pokoli?

☕ A reggeli kávé kihagyása nemcsak hangulatromboló: szinte garantált a lüktető fejfájás, amely sokszor egészen migrénszerűvé is fokozódhat. Aki naponta hozzászokott a koffeinhez, és hirtelen abbahagyja – például, ha...

Az újabb La Niña: gyenge lesz vagy elmarad?

MA 13:26

Az újabb La Niña: gyenge lesz vagy elmarad?

A kutatók szerint idén ősszel és a tél elején ismét megjelenhet a La Niña, de a jelenlegi előrejelzések alapján csak enyhe, rövid életű változatra számíthatunk – vagyis a...

Az Nvidia új trükkje: MI-gyorsító Kínának, exporttilalom ide vagy oda

MA 13:01

Az Nvidia új trükkje: MI-gyorsító Kínának, exporttilalom ide vagy oda

😉 Miközben az USA egyre szigorúbban korlátozza a fejlett MI-chiptechnológia Kínába történő exportját, az Nvidia egy új, Blackwell-alapú grafikus gyorsítón dolgozik, amely kifejezetten a kínai piacra készül. Ez az...