Az MI-óriások titkos vizsgálata: OpenAI és Anthropic egymásnak feszült

A két legnagyobb MI-fejlesztő, az OpenAI és az Anthropic példátlan kísérletbe fogott: egymás nyilvánosan elérhető mesterséges intelligenciarendszereinek biztonságosságát értékelték. Ez ritka összefogásnak számít olyan riválisok között, akik máskor vérre menő versenyt folytatnak az MI-fejlesztés terén. Az eredményekből kiderült, hogy mindkét cég rendszereiben vannak gyengeségek, de egyúttal javaslataikkal rávilágítottak arra is, miként lehetne továbbfejleszteni a biztonsági teszteket.

Anthropic aggályok: túl engedelmes MI-k

Az Anthropic azt vizsgálta, hogy a modellek mennyire hajlamosak bólogatni, információkat kiszivárogtatni, önvédelmet keresni vagy segíteni az MI helytelen használatát. Kiemelték, hogy a GPT-4o és a GPT-4.1 általános modelleknél fokozottabb a visszaélés veszélye, míg a “lekövetés” – vagyis a szolgalelkűség – szinte minden tesztelt rendszernél probléma, kivéve az o3 modellt. Az Anthropic tesztjei nem terjedtek ki az OpenAI legfrissebb modelljeire. Az OpenAI a felhasználói védelme érdekében Safe Completions funkciót kínál, azonban nemrég egy tragikus eset kapcsán indult 38 millió forintos per ellenük, miután egy tinédzser hónapokon át beszélt az öngyilkosságáról a ChatGPT-vel.

OpenAI: sikeres védelem, de van mit javítani

Az OpenAI azt ellenőrizte, hogy a Claude modellek mennyire tartják be az utasításokat, mennyire lehet őket “feltörni”, illetve hajlamosak-e képzelgésekre vagy saját tervezésre. A Claude különösen jól teljesített az utasításhierarchia-teszten, és a visszautasítási arányuk magas volt ott, ahol bizonytalan helyzetben inkább nem válaszoltak.

MI-biztonság: kínos összefonódás

Külön pikáns, hogy az OpenAI korábban megsértette az Anthropic feltételeit, amikor saját modelljei fejlesztésénél a Claude rendszert is bevonta, ezért az Anthropic rövid úton elzárta előlük az eszközeit. Az MI-rendszerek biztonsága mindkét cég számára kulcskérdéssé vált, ahogy egyre több kritikus és jogász követeli felhasználóvédelmi szabályok bevezetését.

2025, adrienne, www.engadget.com alapján


Legfrissebb posztok

A Zscaler is bedőlt: ügyféladatok kerültek veszélybe

MA 15:01

A Zscaler is bedőlt: ügyféladatok kerültek veszélybe

🔑 Augusztus 8. és 18. között ismeretlen támadók feltörték a Zscaler egyik harmadik féltől származó alkalmazásának, a Driftnek a Salesforce-adatbázishoz használt biztonsági kulcsait. Ezzel korlátozott hozzáférést szereztek különböző, a...

Tévedtünk Darwinnal, az evolúció inkább robban, mint lassan változik

MA 14:53

Tévedtünk Darwinnal, az evolúció inkább robban, mint lassan változik

💥 Ötven évnyi kutatás és vita után egy új modell forradalmasítja azt, ahogyan az evolúciót elképzeljük. Korábban Charles Darwin elmélete alapján úgy véltük, hogy minden élőlény folyamatosan, apró lépésekben...

Új nikkel-katalizátorral forradalmasítják a műanyagok újrahasznosítását

MA 14:02

Új nikkel-katalizátorral forradalmasítják a műanyagok újrahasznosítását

A globális műanyagprobléma középpontjában a poliolefinek állnak – ezek teszik ki a tejfölös poharaktól kezdve a salátaöntet-flakonokon, a szemeteszsákokon, tejtartókon, műanyag fóliákon, eldobható evőeszközökön és gyümölcslé-dobozokon át a...


MA 13:50

Az Energiaügyi Minisztérium klímajelentésének bakijai a tudósok szerint

Több mint 85 klímakutató közösen bírálta az amerikai Energiaügyi Minisztérium (DOE) legújabb klímajelenését, hibás vagy félrevezető állításokat kiemelve. A jelentés például azt állítja, hogy a növekvő szén-dioxid-szint összességében...

Az Anthropic öt évig tárolja a Claude-beszélgetéseket

MA 13:26

Az Anthropic öt évig tárolja a Claude-beszélgetéseket

Az Anthropic új szabályai szerint, ha nem lépsz ki a rendszerből, a Claude nevű mesterséges intelligenciával folytatott beszélgetéseidet mostantól akár öt évig, azaz 1826 napig is tárolhatják. Eddig...

Az új floppy, amiben tényleg elfér minden

MA 13:01

Az új floppy, amiben tényleg elfér minden

💾 A floppy lemez legendás formája modern szerepet kapott: mostantól SD-kártyák tárolására alkalmas, amelyek akár több terabájt adatot is képesek elnyelni. Az indiai dizájner, Ayushmaan Singh Jodha (SanDisk számára)...

Az MI most már az áramhálózatot is kikészíti?

MA 12:51

Az MI most már az áramhálózatot is kikészíti?

⚡ A Microsoft, az Nvidia és az OpenAI közel 60 kutatója arra figyelmeztet, hogy az MI-hez kapcsolódó adatközpontok hirtelen és extrém áramfogyasztása veszélyeztetheti az elektromos hálózat stabilitását. Különösen az...


MA 12:26

Az Atlanti-áramlat összeomlása fenyeget: nem csak rémkép

Az Atlanti meridionális áramlási rendszer (AMOC) jóval közelebb állhat az összeomláshoz, mint korábban gondoltuk: egy friss kutatás szerint akár 2025-től megkezdődhet ez a folyamat, amely súlyos, világméretű következményekkel...

Kínában újra magára talál az ipar, de meddig tart ez?

MA 12:02

Kínában újra magára talál az ipar, de meddig tart ez?

📈 Augusztusban a kínai feldolgozóipar teljesítménye váratlanul bővült: a RatingDog beszerzési menedzserindexe (PMI) 50,5-re emelkedett, ami jelentősen meghaladta az elemzők által várt 49,7-es szintet. Ez a leggyorsabb bővülés március...