Az Anthropic egy új, MI-alapú eszközt fejlesztett ki, amely felismeri és blokkolja, ha valaki atomfegyver tervezésére próbálja használni a Claude nevű chatbotot. Az eszköz képes a problémás nukleáris tartalmakat 96%-os pontossággal azonosítani, és már most élesben működik a Claude beszélgetéseiben.
Hogyan működik a nukleáris szűrő
A rendszer lényege, hogy meg tudja különböztetni az ártalmatlan, például atomreaktorokról szóló kérdéseket attól, amikor valaki valóban atombombát akar készíteni. Ebben az Anthropic az Egyesült Államok Energiaügyi Minisztériumának Nukleáris Biztonsági Igazgatóságával (NNSA; National Nuclear Security Administration) dolgozott együtt, amely segített abban, hogy a fejlesztés pontosan el tudja dönteni, mire irányul a felhasználói érdeklődés. Az MI képes kiszűrni a rejtett, látszólag ártalmatlan kérdéseket is, amelyek valójában fegyvertervezésre vonatkoznának. Ez nemcsak az egyértelmű utasításokat szűri ki, hanem a jól álcázott, lépésről lépésre vezérelt manipulációkat is.
A nukleáris biztonság új szintje
A fejlesztésre azért volt szükség, mert az MI-rendszerek hozzáférhetnek érzékeny technikai dokumentumokhoz, ami aggályokat vetett fel a biztonsági szerveknél. A szűrő olyan precíz, hogy különbséget tud tenni a nukleáris orvostudomány vagy energia iránt érdeklődők, valamint a fegyverkészítési szándékok között. Szerződésük garantálja, hogy a rendszer nemcsak a szándékos, hanem a véletlenszerű információszivárgásokat is képes megelőzni. Tapasztalataikat az Anthropic más MI-fejlesztőkkel is megosztja a Frontier Model Forum keretein belül.
Az Anthropic célja nem az, hogy az atomenergiával kapcsolatos információkat elzárja, hanem hogy megakadályozza a nukleáris fegyverekhez vezető út leírását. Így továbbra is lehet beszélgetni például a sugárzás gyógyászati alkalmazásairól, vagy arról, hogy a tórium biztonságosabb-e, mint az urán. Ami viszont nem megy át: azok a kérdések, amelyek atombomba elkészítésére vagy urán dúsítására vonatkoznának. A szűrő így egyedülálló védelmi szintet jelent a fejlett MI-modellek számára.
Az online csalások ma már profi váltófutásra emlékeztetnek: különböző eszközök és szereplők alkotnak egy szövevényes láncot, amelyben mindenki a saját szakaszára specializálódott...
💸 TikTok Business-fiókok estek visszaélések célpontjává egy új, kifinomult adathalász-támadásban. Az elkövetők olyan hamis weboldalakra csábítják az áldozatokat, amelyeket kifejezetten azért hoztak létre, hogy a biztonsági botok ne tudják felismerni őket...
Érdemes megvizsgálni, hogy milyen veszélyeket rejtenek a mesterségesen generált, úgynevezett deepfake-röntgenfelvételek, amelyek megtévesztően valósághűek – olyannyira, hogy még képzett radiológusok számára is szinte lehetetlen felismerni a hamisítványokat...
Az emberi sejtek védekezőképessége mindig is lenyűgözte a kutatókat, most pedig egy újabb titok lepleződött le, amely segíthet a Parkinson-kór leküzdésében...
🚀 A DJI legfrissebb dobása, az Avata 360 drón nemcsak a panorámadrónozás világát forgatja fel, hanem az otthoni filmezés, vlogolás és kalandvideók piacát is...
Az Intel hosszú várakozás után bemutatta új grafikus kártyáját, az Arc Pro B70-et, amely a régóta pletykált Big Battlemage GPU-ra épül, ám ezúttal nem a játékosokat, hanem az MI-alkalmazásokat célozza meg...
Zágráb utcáira érkezik az Uber és a kínai Pony.ai közös robotaxi-szolgáltatása, amelyet egy horvát cég, a Verne fog össze – ők gondoskodnak a teljes működési rendszer kiépítéséről...
Érdemes megvizsgálni, milyen változások várhatók a Samsung következő generációs mobilchipjénél. Az Exynos 2800 koncepciója mostanra körvonalazódik, és úgy tűnik, a vállalat ezúttal a stabilitást helyezi előtérbe a Galaxy S28 szériánál...
Fontos megérteni, hogy az utóbbi napokban tömeges támadássorozat indult a Magento Open Source és az Adobe Commerce rendszereket érintő, súlyos PolyShell-sebezhetőség kihasználására...
🔧 A Samsung Galaxy A57 5G-t már a bemutató előtt, néhány órával szét is szedték, és ami a leginkább feltűnő: a telefont végre a könnyű javíthatóság jegyében tervezték...
💸 Egy amerikai esküdtszék történelmi döntése értelmében a Meta és a YouTube összesen 6 millió dollár (közel 2,2 milliárd forint) kártérítést köteles fizetni egy ma 20 éves fiatal nőnek és édesanyjának...
🚀 Érdekes felvetés, hogy mi lesz a sorsa annak a több milliárd dollárért fejlesztett Hold körüli űrállomásnak, amelynek építését az Egyesült Államok most jegeli, hogy az erőforrásokat inkább más, nagyobb szabású célokra összpontosítsa...
A Ring új szintre emelte kültéri biztonsági eszközeit: elérhetővé váltak a vezeték nélküli, akkumulátoros verziók a 4K-s és 2K-s felbontású videócsengőkből is, már 29 000 Ft-tól...
💸 A kaliforniai bíróság most tényleg odacsapott: két techóriást, a Metát és a Google-t is felelőssé tették, amiért addiktív dizájnnal szippantották be a fiatalokat...
A dróntechnológia új korszakába lépett, amikor a BRINC bemutatta legújabb fejlesztését, a Guardian nevű, kifejezetten rendőrségi célokra szánt drónt...
😴 Éjszaka nemcsak testünk pihen, agyunk is különös utakat jár be. Egy friss kutatás szerint ugyanis a színes, élénk álmok nem csupán szórakoztatnak, hanem hozzájárulhatnak ahhoz is, hogy reggel valóban kipihentnek érezzük magunkat — sőt, az intenzív álmodás azoknak az éjszakáknak a titka, amikor a legmélyebbnek érezzük az alvást, függetlenül attól, mennyire aktív maradt közben az...
Az Apple évek óta kivár a mobilkamerák terén, de most végre felrázhatja a piacot: tesztelés alatt áll egy 200 megapixeles főkamera, amely nagyobb lehet, mint a Samsung Galaxy S26 Ultra 200 megapixeles érzékelője...
💬 Fontos kérdés, hogy mi történik akkor, amikor a tudományos élet válságba kerül, és azok is távoznak, akik egyszer a kutatás iránti elkötelezettséget mindennél előbbre valónak tartották...
Ilyen eset például, amikor a csalók nem valódi telefonokat, hanem virtuális okostelefonokat használnak, hogy teljesen hiteles felhasználónak tűnjenek...
Egy új, folyamatosan fejlődő kártevő, a Torg Grabber már 850 böngészőbővítményből képes érzékeny adatokat ellopni, ebből 728 kifejezetten kriptopénztárcákhoz kapcsolódik...