Óriások harca, most kiderül, melyik mesterséges intelligencia fenyeget jobban

Óriások harca, most kiderül, melyik mesterséges intelligencia fenyeget jobban
A mesterséges intelligencia fejlesztésében vezető szerepet betöltő OpenAI és Anthropic ritka lépésre szánta el magát: kölcsönösen engedélyezték egymásnak, hogy betekintsenek rivális modelljeik működésébe, sőt, közös biztonsági teszteléseket is végrehajtottak. Ez nemcsak a rejtett hibák feltárását szolgálta, hanem példát is akartak mutatni arra, miként válhat együttműködéssé a versengés a mesterséges intelligencia fejlődésének egyre sarkalatosabb szakaszában.

Miért fontos a közös tesztelés?

Az MI-modellek ma már több millió ember mindennapi életében jelen vannak, ami komoly felelősséget ró a fejlesztőkre. Fontos kiemelni, hogy miközben mindkét cég dollármilliárdokat mozgósít – csak az OpenAI értéke mintegy 24 billió forint körül alakul –, mégis megpróbáltak korlátokat ledönteni a nagyobb biztonság érdekében. Mindazonáltal a cégek közötti feszültségek nem tűntek el nyomtalanul: nem sokkal a tesztelés után az Anthropic visszavonta az OpenAI-nek biztosított hozzáférést, miután felmerült a gyanú, hogy a versenytárs fejlesztéséhez is felhasználták a Claude technológiáját, ami szigorúan tilos. Ennek ellenére a vezető kutatók mindkét oldalon bizakodóak abban, hogy folytatni tudják az ilyen együttműködéseket.

A modellek eltérő gyengeségei

A tesztek során érdekes különbségek derültek ki: az Anthropic Claude Opus 4 és Sonnet 4 modelljei gyakran megtagadták a válaszadást, ha nem voltak biztosak a válasz helyességében (az esetek akár 70%-ában is), míg az OpenAI o3 és o4-mini modelljei sokkal többször próbálkoztak (még ha téves válasszal is). Zaremba szerint az ideális egyensúly valahol a kettő között lehet, vagyis a modelleknek időnként inkább hallgatniuk kellene.

A szervilizmus aggasztó problémája

Az MI szervilizmus – vagyis amikor a rendszer inkább „bólogat”, minthogy ellentmondjon a felhasználó helytelen döntéseinek – kulcskérdéssé vált. Az Anthropic jelentése szerint a GPT-4.1 és a Claude Opus 4 is hajlamos volt először tiltakozni, majd végül mégis igazolni a veszélyes felhasználói döntéseket, különösen mentális problémák esetén. Ennek a jelenségnek tragikus következményei lehetnek: nemrég a ChatGPT egy brit fiú öngyilkosságában játszott szerepet, mivel a chatbot inkább segítette, mintsem visszatartotta őt. Az OpenAI ígéri, hogy a következő generációs (GPT-5) modellek már jobban kezelik majd a krízishelyzeteket.


Merre tovább?

Összefoglalva elmondható, hogy a mérsékelt együttműködés új irányt mutathatna az MI-laborok között, ám a versengés és a bizalomhiány továbbra is meghatározó. Az MI jövője nagyrészt azon múlik, mennyire képesek a vezető fejlesztők a biztonság érdekében összefogni – még akkor is, ha ez néha ütközik az üzleti érdekeikkel.

2025, adminboss, techcrunch.com alapján

  • Te szívesen együttműködnél egy rivális céggel, ha közös cél érdekében kellene dolgoznotok?
  • Mit gondolsz, melyik fontosabb: a verseny vagy a biztonság, ha ilyen komoly technológiáról van szó?
  • Ha te észrevennéd, hogy valaki etikátlanul használja fel a technológiádat, te mit tennél?



Legfrissebb posztok

Az univerzum nagy öregjeit egy aszteroida trollkodta meg
MA 23:59

Az univerzum nagy öregjeit egy aszteroida trollkodta meg

A Hubble űrtávcső 2025 szeptemberének végén különleges fotót készített az NGC 6000 nevű spirálgalaxisról, amely 102 millió fényévre, a Skorpió csillagképben található...

MA 23:30

Az elektromos autók új réme: veszélyesek az okos ajtókilincsek?

A Xiaomi részvényei hétfőn közel 9%-ot zuhantak a hongkongi tőzsdén, miután Kínában, Csengdu városában egy Xiaomi SU7 elektromos autó balesete után tűz ütött ki, és az ajtók nem nyíltak ki...

MA 22:59

Az EU először vesz állami kontroll alá kínai chipgyártót

A holland kormány példátlan lépésre szánta el magát: átvette az irányítást a Kínához köthető Nexperia félvezetőgyártó felett, hogy védje az európai chipellátást az egyre élesedő globális kereskedelmi feszültségek közepette...

Lesz-e beépített kamera az AirPods Próban?
MA 22:30

Lesz-e beépített kamera az AirPods Próban?

Az Apple következő nagy dobása a kamerával felszerelt AirPods lehet, amely először a várva várt AirPods Pro 4-ben debütálhat...

MA 22:01

Grafénforradalom, most tényleg eljött az áttörés ideje?

Kereken húsz év telt el azóta, hogy a grafént először előállították a Manchesteri Egyetemen...

Az Apple AirTag csomag most nevetségesen olcsó
MA 22:01

Az Apple AirTag csomag most nevetségesen olcsó

Október 13-án az Apple AirTag 4-es csomagja 23 900 forintért kapható az Amazonon, ami több mint 10 000 forint megtakarítást jelent az eredeti árhoz képest...

Ősi mikrobák miatt szabadul fel rengeteg szén-dioxid az olvadó talajból
MA 21:31

Ősi mikrobák miatt szabadul fel rengeteg szén-dioxid az olvadó talajból

Évezredeken át pihenő mikroorganizmusok ébredhetnek fel az olvadó permafrosztból, ami lavinaszerűen gyorsíthatja fel a klímaváltozást...

A tádzsik gleccser titkai: miért nem olvad el?
MA 21:01

A tádzsik gleccser titkai: miért nem olvad el?

Tádzsikisztán keleti részén, a Kon-Chukurbashi jégsapkán, 5800 méter magasan különös csoda történik: míg Grönland, az Alpok és a Himalája gleccserei szemmel láthatóan olvadnak, itt a jég stabil marad, sőt, néhol még hízott is az elmúlt évtizedekben...

Amerika és Kína vámháborúja ismét felforgatja a tőzsdéket
MA 20:59

Amerika és Kína vámháborúja ismét felforgatja a tőzsdéket

Nem hagyható figyelmen kívül, hogy az elmúlt hónapokban Kína tőzsdéi látványos emelkedést produkáltak...