MA 08:20

Az Anthropic hátat fordít a zászlóshajó biztonsági ígéretének

Az Anthropic hátat fordít a zászlóshajó biztonsági ígéretének
Az Anthropic, amelyet hosszú ideig a legbiztonságtudatosabb MI-fejlesztőként emlegettek, alapjaiban változtatott eddigi vállalásain. A cég 2023-ban még azt ígérte, hogy csak akkor fejleszt új MI-rendszert, ha előzetesen garantálni tudja a megfelelő biztonsági intézkedéseket. Most azonban az Anthropic vezetői úgy döntöttek, mégsem tartják tovább ezt a szigorú korlátot.

Biztonsági irányelvek teljes átalakítása

Az új irány azt jelenti, hogy a jövőben a vállalat nem kötelezi el magát amellett, hogy kizárólag akkor lép tovább, ha már minden kockázatot sikerült elhárítani. Jared Kaplan tudományos igazgató szerint a gyors technológiai fejlődés közepette önmagában kevés lenne, ha leállítanák a fejlesztéseket, miközben a rivális cégek szinte fékezhetetlen tempóban haladnak előre. Ebből adódóan az új szabályzat szerint az Anthropic úgy módosítja stratégiáját, hogy vállalja: a továbbiakban részletesebb információkat tesz közzé MI-modelljei biztonsági tesztjeiről, átláthatóbban kezeli a kockázatokat, és legalább olyan szigorú szabályokat alkalmaz, mint a versenytársak.

A cég most már csak akkor késlelteti a fejlesztést, ha a vezetők úgy látják, hogy az Anthropic az MI-verseny éllovasa, és a potenciális katasztrófa kockázata jelentősre nőtt. Ezzel együtt a változtatás lényegesen nagyobb mozgásteret ad: az Anthropic immár nem korlátozza magát egyes biztonsági követelmények hiányában, ahogyan az eddigi elvek szerint tette volna.

Száguldó cég, ajtók bezárulnak

Az Anthropic az elmúlt időszakban jelentős technológiai és kereskedelmi sikereket aratott: a Claude modellek, különösen a Claude Code nevű szoftverfejlesztő eszköz, széles rajongótábort szerzett, míg 2024 februárjában 10 800 milliárd forint (30 milliárd dollár) friss befektetést vont be, cégértékét pedig 136 800 milliárd forintra (380 milliárd dollár) becsülték. Az évesített árbevételük ráadásul tízszeres növekedést mutatott. Eközben befektetők szerint a vállalat hitelesebb üzleti modellt épít, mivel közvetlenül cégeknek értékesít, szemben az OpenAI főként fogyasztói stratégiájával.

Kaplan visszautasította a vádat, hogy az Anthropic a piaci kényszer miatt változtatott volna irányt. Szerinte inkább szükségszerű, gyakorlati válasz született az új politikai és technikai helyzetre, nem pedig hirtelen pálfordulás.

Nemzetközi szabályozás hiányában szabad a pálya

Az RSP (Responsible Scaling Policy) bevezetésekor az Anthropic abban bízott, hogy más cégek is példát vesznek majd róluk, és hogy a szigorúbb hozzáállás lehet idővel a nemzeti vagy akár globális szabályozás alapja. Ám a várva várt törvényi keretek végül elmaradtak; az Egyesült Államokban a kormányzat inkább szabad utat adott az MI-fejlesztéseknek, a szövetségi szabályozás jele sem látszik, és a három évvel korábban még reálisnak tűnő nemzetközi egyezmények is lekerültek a napirendről. Közben az MI-fejlesztési verseny cégek és országok között is minden korábbinál élesebb lett.


Új problémák, elmosódó határok

A biztonsági kockázatok tudományos értékelése is bonyolultabb feladatnak bizonyult, mint azt korábban remélték. A fejlődő modelleknél 2025-ben maga az Anthropic sem tudta kizárni, hogy MI közreműködhet egy bioterrorista támadásban – noha ezt nem bizonyította semmilyen tudományos adat sem. Így egyértelmű, jól felismerhető kockázati határ helyett inkább folyamatos, bizonytalan szürkezónát láttak maguk előtt.

A vezetők hónapokon át keresték a módját, miként lehetne a zászlóshajó biztonsági programot a helyzethez igazítani: úgy gondolták, felelős kutatói munka csak akkor lehetséges, ha a legfejlettebb modelleket is házon belül tudják tartani, még akkor is, ha ezzel potenciálisan közelebb hozzák a veszélyeket.

Új ígéretek: átláthatóság és rendszeres jelentések

Mostantól az Anthropic rendszeresen közzétesz részletes kockázati jelentéseket, három-hat havonta. Ezek bemutatják, milyen veszélyeket jelentenek az új képességek, milyen fenyegetési modellekben gondolkodnak, és hogyan illeszkednek a jelenlegi kockázatkezelési lépésekhez. A jövőbeli biztonsági terveket úgynevezett határterületi biztonsági ütemterv (Frontier Safety Roadmap) formájában hozzák nyilvánosságra, hogy a belső fejlesztési ösztönzők fennmaradjanak, még akkor is, ha ez szembe megy az azonnali üzleti érdekekkel.

Chris Painter, a METR szakértője fontos előrelépésnek tartja a nagyobb átláthatóságot, viszont aggasztónak érzi, hogy megszűnik a korábbi éles, objektív küszöb, amelynél a veszélyes fejlesztések leállíthatók lettek volna. Szerinte ez ahhoz vezethet, hogy szinte észrevétlenül nőnek a kockázatok.

A meglepetések sora itt nem áll meg

Noha az Anthropic továbbra is kiáll a felelős MI-fejlesztés mellett, a mostani bejelentés egyértelmű fordulatot jelent. A cég már nem köti magát a legszigorúbb önkorlátozáshoz, inkább a piac tempójához és a folyamatos kockázatértékeléshez igazítja stratégiáját. Így a „felelős fejlesztő” szerepe is új értelmezést nyer: a hangsúly a folyamatos felügyeleten, az átláthatóságon és a gyors reagáláson lesz – miközben az MI-verseny tétje tovább nő.

2025, adminboss, time.com alapján

Legfrissebb posztok

MA 11:40

A Wayve brutális tőkét kapott: itt az MI forradalma

Ez a jelenség jól illusztrálja, hogy a brit Wayve MI-startup most 1,2 milliárd dollárt, azaz közel 433 milliárd forintot vont be befektetőktől, köztük olyan technológiai óriásoktól, mint az Nvidia és az Uber, valamint három autóipari világmárkától...

MA 11:20

Az áttörés: fél évszázad után megszületett az első szilíciumos aromás vegyület

A Saarland Egyetem vegyészei végre elérték azt, amire fél évszázada várt a tudományos világ: sikerült szintetizálniuk egy régóta keresett szilíciumalapú aromás molekulát...

MA 11:01

Az OpenAI keményen visszavágott Elon Musknak és az xAI-nak

💪 Az OpenAI most simán visszaverte az xAI egyik jogi támadását, amely állítólag titkos információk és munkaerő lenyúlásáról szólt...

MA 10:55

Újabb Discord-csúszás: továbbra sem kötelező a korigazolás

📤 Egyre több online platform kényszerül szigorúbb intézkedések bevezetésére a fiatalkorú felhasználók védelme érdekében...

MA 10:47

Az alaszkai mamutagyarak átírják Amerika benépesülésének történetét

Alaszka középső részén, a Tanana-völgyben meglepően régi, 14 ezer éves eszközök kerültek elő, amelyek új fényt vetnek arra, hogyan jutottak el az első emberi közösségek Amerikába...

MA 10:29

A legújabb trükk: digitális csalók csapnak le a szállítmányozásra

Lényeges szempont, hogy a fuvarozói és logisztikai cégek mostanában nemcsak a kamionjaikra, hanem a digitális rendszereikre is nagy veszélyek leselkednek...

MA 10:19

Az amerikai napenergia diadala: már lehagyta a vízenergiát

2025-ben az Egyesült Államok áramfogyasztása ugrásszerűen megnőtt, mintegy 2,8 százalékkal, vagyis 121 terawattórával az előző évhez képest...

MA 10:02

A DJI visszavág: pert indít az FCC ellen az amerikai importtilalom miatt

🛡 A világ legnépszerűbb fogyasztói dróngyártója, a kínai DJI pert indított az Amerikai Szövetségi Hírközlési Bizottság (FCC) ellen az Egyesült Államokban érvényben lévő importtilalom miatt...

MA 09:55

Az Uránusz egén féktelen fényviharok tombolnak

⚡ A James Webb űrtávcső lenyűgöző részletességgel térképezte fel az Uránusz rejtélyes felső légkörét, és olyan, eddig ismeretlen jelenségeket fedezett fel, amelyek új fényt vetnek a bolygó furcsa mágneses terére, illetve a légkörében tomboló sarki fényekre...

MA 09:46

A rejtett szikra az Alzheimer mögött: láthatatlan vérellátási zavar

💡 Az Alzheimer-kór kialakulására mindig is az agyi plakkok és a memóriavesztés szolgált magyarázatul, de most friss kutatások új tényezőre hívják fel a figyelmet...

MA 09:37

A mesterséges intelligencia nem könyvelő – vagy hamarosan az lesz?

🤖 Nem hiszem el, de idén tényleg érdemes korábban nekiállni az adóbevallásnak – főleg, mert a 2025-ös gigatörvény (OBBBA) miatt mindenki meglepetésekre számíthat...

MA 09:28

Az évszázad felfedezése: megfejtették az ősi görbék titkát

Évezredek óta foglalkoztatja a matematikusokat, miként lehet megtalálni a különleges, úgynevezett racionális pontokat a görbéken...

MA 09:19

Az életkor-ellenőrzés Discordon csúszik, de megúszni nem lehet

Külön említést érdemel, hogy a Discord jelentős változást jelentett be: elhalasztják a felhasználók életkor-ellenőrzésére vonatkozó intézkedések bevezetését...

MA 09:10

Az LG brutális gamer monstruma: 132 cm élmény kétmillióért

Na most kapaszkodj, mert az LG előállt egy bestiális gamer monitorral, ami alapjaiban rengeti meg a setupodat...

MA 09:02

A Rozsomák végre berobban PS5-re: vér, karmok, szeptember!

El sem hisszük, de tényleg: a Rozsomák (Marvel’s Wolverine) megjelenési dátuma felkerült a PlayStation csatornájára, és már szeptember 15-én érkezik!..

MA 08:55

Az Apple világszerte szigorítja a 18+-os appok letöltését

🔒 Felmerül a kérdés, hogy az online biztonság érdekében meddig mehetnek el a techóriások, és az Apple ismét lépett: új korhatár-ellenőrző eszközöket vezet be világszerte, hogy megfeleljen a gyermekvédelmi jogszabályok egyre szövevényesebb hálójának...

MA 08:47

A túl tág bérsávok elriaszthatják a női pályázókat

Jellemző példa erre, hogy két, ugyanott meghirdetett, ugyanolyan állás sincs azonos árazással – az egyik cégnél a fizetés 7 millió forinttól 36 millió forintig terjed, egy másiknál viszont szűk sávban, 35 és 39 millió forint között van...

MA 08:37

Az első amerikai kriptobank felturbózza bitcoin-tartalékait

Anchorage Digital, az Egyesült Államok első szövetségi kriptobankja, a saját mérlegére vette a Strategy nevű, bitcoin-kincstárral rendelkező cég örökjáradék jellegű elsőbbségi részvényeit...

MA 08:29

Az apai törődést kegyetlenséggé fordító gén: váratlan egérkísérleti bizonyíték

🙀 Ilyen eset például, amikor egyetlen gén képes alapjaiban átírni az apai viselkedést...

MA 08:02

Az MI-fejlesztők végre kilépnek a képernyő mögül

💻 Érdekes felvetés, hogy milyen hatást gyakorolhat a fejlesztésre, ha a legnépszerűbb MI-s kódíró ügynök, a Claude Code mostantól mobileszközökről is vezérelhető...

MA 07:55

Az Nvidia új laptopjai: itt a vékony gamer gépek forradalma?

💻 A legfrissebb pletykák szerint idén év elején érkezhetnek meg a Dell és a Lenovo első olyan laptopjai, amelyekben már az Nvidia által fejlesztett Arm-alapú CPU dolgozik...

MA 07:47

Az utolsó vérhold: így követheted élőben a teljes holdfogyatkozást

🌙 Március 3-án hajnalban az észak-amerikai megfigyelők utoljára gyönyörködhetnek teljes vérholdban egészen 2029-ig...

MA 07:37

Súlyos bírságot szabott ki a brit hatóság a Redditre a laza korhatár-ellenőrzésért

Külön említést érdemel, hogy a brit adatvédelmi hatóság, az ICO 14,5 millió fontnyi, azaz körülbelül 7,1 milliárd forintos büntetést szabott ki a Redditre, mert a platform nem ellenőrizte kellőképpen a felhasználók életkorát...

MA 07:28

Az 1Password drágul, de spórolni még mindig lehet

🔑 Az 1Password jelentősen megemeli az egyéni és családi előfizetési díjakat: az egyéni csomag éves díja 13 200 forintról 17 600 forintra ugrik, míg a családi opció 22 000 forintról 26 400 forintra nő...

MA 07:19

Az észak-koreai hekkerek új fegyvere: Medusa az egészségügy ellen

🕵 Észak-Korea hírhedt Lazarus csoportja újabb zsarolóvírust vetett be: a Medusával már az egészségügyi szektort is célkeresztbe vették...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 2/25

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Astrea: Six-Sided Oracles (iPhone/iPad)Az Astrea egy DICE-deck-building roguelike videojáték, amelyben a megszokott kártyák helyett dobókockákat használsz...

MA 07:10

Az újabb milliárdos csata: Paramount, Netflix és Warner Bros. szappanoperája

💸 Mindenki le van döbbenve, mert most tényleg forrósodik a helyzet Hollywoodban: a Paramount egy teljesen új, csinosabb ajánlatot dobott be a Warner Bros...

MA 07:01

Az első brit baba elhunyt donor méhéből – történelmi áttörés

Grace Bell sosem gondolta volna, hogy egy nap anya lesz – hiszen MRKH-szindrómával született, vagyis sosem volt kialakult méhe...

MA 06:55

A BAFTA új botránya: rasszista üzenet a Google-tól

🚫 Vihar tört ki a BAFTA-díjátadó körül, miután egy Google-értesítésben megjelent egy nyíltan rasszista kifejezés...