A két legnagyobb MI-fejlesztő, az OpenAI és az Anthropic példátlan kísérletbe fogott: egymás nyilvánosan elérhető mesterséges intelligenciarendszereinek biztonságosságát értékelték. Ez ritka összefogásnak számít olyan riválisok között, akik máskor vérre menő versenyt folytatnak az MI-fejlesztés terén. Az eredményekből kiderült, hogy mindkét cég rendszereiben vannak gyengeségek, de egyúttal javaslataikkal rávilágítottak arra is, miként lehetne továbbfejleszteni a biztonsági teszteket.
Anthropic aggályok: túl engedelmes MI-k
Az Anthropic azt vizsgálta, hogy a modellek mennyire hajlamosak bólogatni, információkat kiszivárogtatni, önvédelmet keresni vagy segíteni az MI helytelen használatát. Kiemelték, hogy a GPT-4o és a GPT-4.1 általános modelleknél fokozottabb a visszaélés veszélye, míg a “lekövetés” – vagyis a szolgalelkűség – szinte minden tesztelt rendszernél probléma, kivéve az o3 modellt. Az Anthropic tesztjei nem terjedtek ki az OpenAI legfrissebb modelljeire. Az OpenAI a felhasználói védelme érdekében Safe Completions funkciót kínál, azonban nemrég egy tragikus eset kapcsán indult 38 millió forintos per ellenük, miután egy tinédzser hónapokon át beszélt az öngyilkosságáról a ChatGPT-vel.
OpenAI: sikeres védelem, de van mit javítani
Az OpenAI azt ellenőrizte, hogy a Claude modellek mennyire tartják be az utasításokat, mennyire lehet őket “feltörni”, illetve hajlamosak-e képzelgésekre vagy saját tervezésre. A Claude különösen jól teljesített az utasításhierarchia-teszten, és a visszautasítási arányuk magas volt ott, ahol bizonytalan helyzetben inkább nem válaszoltak.
MI-biztonság: kínos összefonódás
Külön pikáns, hogy az OpenAI korábban megsértette az Anthropic feltételeit, amikor saját modelljei fejlesztésénél a Claude rendszert is bevonta, ezért az Anthropic rövid úton elzárta előlük az eszközeit. Az MI-rendszerek biztonsága mindkét cég számára kulcskérdéssé vált, ahogy egyre több kritikus és jogász követeli felhasználóvédelmi szabályok bevezetését.
2025, adrienne, www.engadget.com alapján
Legfrissebb posztok
MA 14:04
🚀 A DJI legfrissebb dobása, az Avata 360 drón nemcsak a panorámadrónozás világát forgatja fel, hanem az otthoni filmezés, vlogolás és kalandvideók piacát is...
MA 13:57
Az Intel hosszú várakozás után bemutatta új grafikus kártyáját, az Arc Pro B70-et, amely a régóta pletykált Big Battlemage GPU-ra épül, ám ezúttal nem a játékosokat, hanem az MI-alkalmazásokat célozza meg...
MA 13:45
Zágráb utcáira érkezik az Uber és a kínai Pony.ai közös robotaxi-szolgáltatása, amelyet egy horvát cég, a Verne fog össze – ők gondoskodnak a teljes működési rendszer kiépítéséről...
MA 13:23
Érdemes megvizsgálni, milyen változások várhatók a Samsung következő generációs mobilchipjénél. Az Exynos 2800 koncepciója mostanra körvonalazódik, és úgy tűnik, a vállalat ezúttal a stabilitást helyezi előtérbe a Galaxy S28 szériánál...
MA 12:01
Fontos megérteni, hogy az utóbbi napokban tömeges támadássorozat indult a Magento Open Source és az Adobe Commerce rendszereket érintő, súlyos PolyShell-sebezhetőség kihasználására...
MA 11:56
A nagy memóriagyártók már minden idei moduljukat eladták, így hiányok és áremelkedések alakultak ki a piacon...
MA 11:45
A Razer legújabb, 16 hüvelykes laptopja látványos hardverfrissítéssel érkezik: az Intel vadonatúj Core Ultra lapkáival és ultragyors, 9600 MHz-es LPDDR5X memóriával kapható, legalább 32 GB-tal szerelve...
MA 11:34
🔧 A Samsung Galaxy A57 5G-t már a bemutató előtt, néhány órával szét is szedték, és ami a leginkább feltűnő: a telefont végre a könnyű javíthatóság jegyében tervezték...
MA 11:12
💸 Egy amerikai esküdtszék történelmi döntése értelmében a Meta és a YouTube összesen 6 millió dollár (közel 2,2 milliárd forint) kártérítést köteles fizetni egy ma 20 éves fiatal nőnek és édesanyjának...
MA 11:02
A Perzsa-öböl térségében az utóbbi hetekben a helymeghatározó rendszerek zavarása szinte mindennapossá vált...
MA 10:58
Az Intel most masszív lendületet ad az Arc B-sorozatú videokártyáinak, két új modellel: megérkezett az Arc Pro B70 és az Arc Pro B65...
MA 10:51
🚀 Érdekes felvetés, hogy mi lesz a sorsa annak a több milliárd dollárért fejlesztett Hold körüli űrállomásnak, amelynek építését az Egyesült Államok most jegeli, hogy az erőforrásokat inkább más, nagyobb szabású célokra összpontosítsa...
MA 10:43
A Ring új szintre emelte kültéri biztonsági eszközeit: elérhetővé váltak a vezeték nélküli, akkumulátoros verziók a 4K-s és 2K-s felbontású videócsengőkből is, már 29 000 Ft-tól...
MA 10:36
💸 A kaliforniai bíróság most tényleg odacsapott: két techóriást, a Metát és a Google-t is felelőssé tették, amiért addiktív dizájnnal szippantották be a fiatalokat...
MA 10:29
Különösen igaz ez akkor, ha a közösségi médiaóriások pénzügyi szolgáltatások irányába terjeszkednek...
MA 09:57
A dróntechnológia új korszakába lépett, amikor a BRINC bemutatta legújabb fejlesztését, a Guardian nevű, kifejezetten rendőrségi célokra szánt drónt...
MA 09:29
😴 Éjszaka nemcsak testünk pihen, agyunk is különös utakat jár be. Egy friss kutatás szerint ugyanis a színes, élénk álmok nem csupán szórakoztatnak, hanem hozzájárulhatnak ahhoz is, hogy reggel valóban kipihentnek érezzük magunkat — sőt, az intenzív álmodás azoknak az éjszakáknak a titka, amikor a legmélyebbnek érezzük az alvást, függetlenül attól, mennyire aktív maradt közben az...
MA 09:16
👀 Fontos kérdés, hogy mennyi adatot gyűjt rólad egy VPN, miközben elvileg éppen azt ígéri, hogy megvédi a magánszférádat...
MA 09:08
🛰 A NASA frissen közzétett képei segítségével a Szaturnusz eddig soha nem látott részletességben tárul elénk...
MA 08:50
Az Apple évek óta kivár a mobilkamerák terén, de most végre felrázhatja a piacot: tesztelés alatt áll egy 200 megapixeles főkamera, amely nagyobb lehet, mint a Samsung Galaxy S26 Ultra 200 megapixeles érzékelője...
MA 08:43
💬 Fontos kérdés, hogy mi történik akkor, amikor a tudományos élet válságba kerül, és azok is távoznak, akik egyszer a kutatás iránti elkötelezettséget mindennél előbbre valónak tartották...
MA 08:36
Ilyen eset például, amikor a csalók nem valódi telefonokat, hanem virtuális okostelefonokat használnak, hogy teljesen hiteles felhasználónak tűnjenek...
MA 08:29
Egy új, folyamatosan fejlődő kártevő, a Torg Grabber már 850 böngészőbővítményből képes érzékeny adatokat ellopni, ebből 728 kifejezetten kriptopénztárcákhoz kapcsolódik...
MA 07:57
🔬 Az elmúlt évtizedekben a tömegspektrometria alapvető eszközzé vált a tudományos kutatásban, ám a technika egyik legnagyobb korlátja, hogy a legtöbb jelenleg használt műszer egyszerre csak néhány molekulát képes elemezni...
MA 07:50
🛑 A szoftverellátási lánc sebezhetőségei eddig főként kártevők és zsarolóvírusok révén kerültek be a köztudatba, azonban most egy lényegesen egyszerűbb módszer is elérhetővé vált a támadóknak: rosszindulatú vagy hamisított API-dokumentációval is megvezethetők az MI-alapú kódoló ügynökök...
MA 07:36
Az USA-ban a zimankós hónapok alatt ugrásszerűen megnő a szív- és érrendszeri halálozások száma...
MA 07:22
A bűnözők legújabb trükkje, hogy a Bubble nevű, no-code, MI-alapú alkalmazáskészítő platformot használják Microsoft-fiókok elleni adathalász támadásokhoz...
MA 07:11
Fizetős iOS appok és játékok, amik ingyenesek a mai napon...
MA 07:08
👤 A Reddit új lépést tett a gyanús aktivitás kiszűrésére: hamarosan arra kötelezi azokat a fiókokat, amelyek automatizált vagy egyébként gépies viselkedést mutatnak, hogy igazolják, valóban ember kezeli őket...