Az MI már a nukleáris bombaterveket is blokkolja

Az MI már a nukleáris bombaterveket is blokkolja
Az Anthropic egy új, MI-alapú eszközt fejlesztett ki, amely felismeri és blokkolja, ha valaki atomfegyver tervezésére próbálja használni a Claude nevű chatbotot. Az eszköz képes a problémás nukleáris tartalmakat 96%-os pontossággal azonosítani, és már most élesben működik a Claude beszélgetéseiben.

Hogyan működik a nukleáris szűrő

A rendszer lényege, hogy meg tudja különböztetni az ártalmatlan, például atomreaktorokról szóló kérdéseket attól, amikor valaki valóban atombombát akar készíteni. Ebben az Anthropic az Egyesült Államok Energiaügyi Minisztériumának Nukleáris Biztonsági Igazgatóságával (NNSA; National Nuclear Security Administration) dolgozott együtt, amely segített abban, hogy a fejlesztés pontosan el tudja dönteni, mire irányul a felhasználói érdeklődés. Az MI képes kiszűrni a rejtett, látszólag ártalmatlan kérdéseket is, amelyek valójában fegyvertervezésre vonatkoznának. Ez nemcsak az egyértelmű utasításokat szűri ki, hanem a jól álcázott, lépésről lépésre vezérelt manipulációkat is.

A nukleáris biztonság új szintje

A fejlesztésre azért volt szükség, mert az MI-rendszerek hozzáférhetnek érzékeny technikai dokumentumokhoz, ami aggályokat vetett fel a biztonsági szerveknél. A szűrő olyan precíz, hogy különbséget tud tenni a nukleáris orvostudomány vagy energia iránt érdeklődők, valamint a fegyverkészítési szándékok között. Szerződésük garantálja, hogy a rendszer nemcsak a szándékos, hanem a véletlenszerű információszivárgásokat is képes megelőzni. Tapasztalataikat az Anthropic más MI-fejlesztőkkel is megosztja a Frontier Model Forum keretein belül.

A nukleáris tudomány nem tabu

Az Anthropic célja nem az, hogy az atomenergiával kapcsolatos információkat elzárja, hanem hogy megakadályozza a nukleáris fegyverekhez vezető út leírását. Így továbbra is lehet beszélgetni például a sugárzás gyógyászati alkalmazásairól, vagy arról, hogy a tórium biztonságosabb-e, mint az urán. Ami viszont nem megy át: azok a kérdések, amelyek atombomba elkészítésére vagy urán dúsítására vonatkoznának. A szűrő így egyedülálló védelmi szintet jelent a fejlett MI-modellek számára.

2025, adrienne, www.techradar.com alapján

  • Te szerinted elég etikus, ha egy gép dönti el, hogy mi a veszélyes információ?
  • Ha te terveznél ilyen szűrőt, milyen szabályokat tennél bele?
  • Mit gondolsz, jó ötlet más MI-fejlesztőkkel is megosztani ezt a technológiát?



Legfrissebb posztok

Az MI végre újra emberi: ChatGPT visszakapta régi személyiségét

MA 09:53

Az MI végre újra emberi: ChatGPT visszakapta régi személyiségét

Sam Altman, az OpenAI vezérigazgatója bejelentette, hogy minden fizetős ChatGPT-felhasználó ismét hozzáférhet a korábbi mesterséges intelligencia modellekhez, köztük a GPT-4o-hoz és régebbi LLM-ekhez, mint az o3 vagy a...

Miért tűnnek ennyire tökéletesnek az Apple üzenetei, mégis olyan furcsák?

MA 09:40

Miért tűnnek ennyire tökéletesnek az Apple üzenetei, mégis olyan furcsák?

💬 Az Apple marketinganyagaiban újra és újra felbukkannak azok a megkomponált, túláradóan optimista, precízen megírt ál-üzenetek, amelyek első pillantásra egy másik univerzumba repítenek. Ebben a világban minden baráti társaság...

Az időjárási blokkokat nem csak a levegő mozgatja

MA 09:27

Az időjárási blokkokat nem csak a levegő mozgatja

Új kutatás tárja fel, milyen meghatározó szerepe van a nedvességnek a légköri blokkok, vagyis a több napig vagy hétig is tartó szélsőséges időjárási helyzetek kialakulásában. Ezek a blokkok...

Újra fellángol a technológiai őrület, sorra érkeznek a tőzsdei sztorik

MA 09:15

Újra fellángol a technológiai őrület, sorra érkeznek a tőzsdei sztorik

🚀 Az elmúlt évek szigorú időszaka után végre fellélegezhetett a tőzsde: a technológiai vállalatok elsődleges részvénykibocsátásai (IPO) ismét látványos sikereket aratnak, mintha egy korábban betiltott buli kapott volna végre...

APPok, Amik Ingyenesek MA, 8/25
APP

MA 09:12

APPok, Amik Ingyenesek MA, 8/25

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Clumsy Bomb (iPhone/iPad)A Clumsy Bomb egy szórakoztató, fizika alapú ügyességi játék, amelyben egy kis bomba sorsát...

Az új Swann kamera, amit elég csak napoztatni

MA 09:01

Az új Swann kamera, amit elég csak napoztatni

A Swann bemutatta legújabb vezeték nélküli, előfizetésmentes otthoni biztonsági kameráját, amely mindössze napi 45 perc napsütéssel egész nap működik – így elfelejtheted az akkucseréket és a havi díjakat....

Mesterséges intelligencia segíthet a termékvisszahívásokban, vajon ez mindent megváltoztat?

MA 08:53

Mesterséges intelligencia segíthet a termékvisszahívásokban, vajon ez mindent megváltoztat?

🤔 Lényeges hangsúlyozni, hogy az Amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) legutóbbi felszólítása után egyre nagyobb nyomás nehezedik a vállalatokra, hogy hatékonyabban kommunikálják a termékvisszahívásokat. Nem véletlen: az elmúlt...

Őseinktől kapott gének ma is segítenek, hogy túléljünk

MA 08:27

Őseinktől kapott gének ma is segítenek, hogy túléljünk

👑 Nem hagyható figyelmen kívül, hogy az amerikai őslakosok immunrendszerét évezredeken át erősítette egy olyan genetikai örökség, amelyet eltűnt emberi rokonainktól, a gyakorlatilag rejtélyes Denisovaiaktól örököltek. Egy friss kutatás...

A Mesterséges Intelligencia sem segített: feltörték a Workday rendszerét

MA 08:14

A Mesterséges Intelligencia sem segített: feltörték a Workday rendszerét

A Workday, a HR-technológiában piacvezető cég elismerte, hogy adatszivárgás érte egy harmadik féltől származó CRM-platformját. A támadók kifinomult szociális manipulációval csapták be a cég alkalmazottait, IT- vagy HR-szakembernek...