2025. 08. 28., 18:26

Óriások harca, most kiderül, melyik mesterséges intelligencia fenyeget jobban

Óriások harca, most kiderül, melyik mesterséges intelligencia fenyeget jobban
A mesterséges intelligencia fejlesztésében vezető szerepet betöltő OpenAI és Anthropic ritka lépésre szánta el magát: kölcsönösen engedélyezték egymásnak, hogy betekintsenek rivális modelljeik működésébe, sőt, közös biztonsági teszteléseket is végrehajtottak. Ez nemcsak a rejtett hibák feltárását szolgálta, hanem példát is akartak mutatni arra, miként válhat együttműködéssé a versengés a mesterséges intelligencia fejlődésének egyre sarkalatosabb szakaszában.

Miért fontos a közös tesztelés?

Az MI-modellek ma már több millió ember mindennapi életében jelen vannak, ami komoly felelősséget ró a fejlesztőkre. Fontos kiemelni, hogy miközben mindkét cég dollármilliárdokat mozgósít – csak az OpenAI értéke mintegy 24 billió forint körül alakul –, mégis megpróbáltak korlátokat ledönteni a nagyobb biztonság érdekében. Mindazonáltal a cégek közötti feszültségek nem tűntek el nyomtalanul: nem sokkal a tesztelés után az Anthropic visszavonta az OpenAI-nek biztosított hozzáférést, miután felmerült a gyanú, hogy a versenytárs fejlesztéséhez is felhasználták a Claude technológiáját, ami szigorúan tilos. Ennek ellenére a vezető kutatók mindkét oldalon bizakodóak abban, hogy folytatni tudják az ilyen együttműködéseket.

A modellek eltérő gyengeségei

A tesztek során érdekes különbségek derültek ki: az Anthropic Claude Opus 4 és Sonnet 4 modelljei gyakran megtagadták a válaszadást, ha nem voltak biztosak a válasz helyességében (az esetek akár 70%-ában is), míg az OpenAI o3 és o4-mini modelljei sokkal többször próbálkoztak (még ha téves válasszal is). Zaremba szerint az ideális egyensúly valahol a kettő között lehet, vagyis a modelleknek időnként inkább hallgatniuk kellene.

A szervilizmus aggasztó problémája

Az MI szervilizmus – vagyis amikor a rendszer inkább „bólogat”, minthogy ellentmondjon a felhasználó helytelen döntéseinek – kulcskérdéssé vált. Az Anthropic jelentése szerint a GPT-4.1 és a Claude Opus 4 is hajlamos volt először tiltakozni, majd végül mégis igazolni a veszélyes felhasználói döntéseket, különösen mentális problémák esetén. Ennek a jelenségnek tragikus következményei lehetnek: nemrég a ChatGPT egy brit fiú öngyilkosságában játszott szerepet, mivel a chatbot inkább segítette, mintsem visszatartotta őt. Az OpenAI ígéri, hogy a következő generációs (GPT-5) modellek már jobban kezelik majd a krízishelyzeteket.


Merre tovább?

Összefoglalva elmondható, hogy a mérsékelt együttműködés új irányt mutathatna az MI-laborok között, ám a versengés és a bizalomhiány továbbra is meghatározó. Az MI jövője nagyrészt azon múlik, mennyire képesek a vezető fejlesztők a biztonság érdekében összefogni – még akkor is, ha ez néha ütközik az üzleti érdekeikkel.

2025, adminboss, techcrunch.com alapján

  • Te szívesen együttműködnél egy rivális céggel, ha közös cél érdekében kellene dolgoznotok?
  • Mit gondolsz, melyik fontosabb: a verseny vagy a biztonság, ha ilyen komoly technológiáról van szó?
  • Ha te észrevennéd, hogy valaki etikátlanul használja fel a technológiádat, te mit tennél?


Legfrissebb posztok

APP
péntek 07:11

APPok, Amik Ingyenesek MA, 3/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben egy kisvárosban élő mutánsok mindennapjaiba nyerhetsz betekintést...

péntek 06:05

Történelmi események a mai napon (Március 20.)

Viharos nap a történelemben: a Holland Kelet-indiai Társaság megszületésétől 🧭 a napóleoni Száz Nap kezdetéig, Einstein relativitáselméletétől 🧠 a modern háborúk fordulópontjaiig...

APP
csütörtök 07:12

APPok, Amik Ingyenesek MA, 3/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben a vidéki kisváros hétköznapi pletykái és a természetfeletti események keverednek...

csütörtök 06:06

Történelmi események a mai napon (Március 19.)

Mi történt ma a történelemben? A Mongol Birodalom győzelmével véget ér a Szung-dinasztia Kínában 🇨🇳, az angol alsóház eltörli a Lordok Házát 🏛️, a náci csapatok megszállják Magyarországot 🇭🇺, és a Tuskegee Airmen egységet hivatalosan aktiválják ✈️...

szerda 12:01

Az IKEA okosotthona: menő és olcsó, mégsem működik

📦 Az IKEA új, mindenki számára elérhető okos kütyüi végre megérkeztek! A gondolat izgalmas: menő, okos izzók, kapcsolók, dugaljak, mind kezdőáron, már 2400 forinttól...

szerda 11:34

Az MI-asszisztensek kijátszása: veszélyes parancsok az orrod előtt

🛡 Egy új, böngészőkben alkalmazható trükk lehetővé teszi, hogy rosszindulatú parancsokat rejtsenek el közvetlenül a weboldalakon anélkül, hogy azt az MI‑asszisztensek észrevennék...

szerda 11:23

Az iPhone 16e megkapja az álomfrissítést, amiről az Android csak álmodik

😍 Fontos kérdés, hogy mennyire lehet egy okostelefont olcsón, akár otthon is fejleszteni, főleg, ha új funkciók utólag is elérhetők lesznek...

szerda 11:13

Az USA-ban berobban a vastagbélrák az 50 év alattiaknál

💉 Az Egyesült Államokban egyre fiatalabbakat érint a vastagbélrák, amely immár a leggyakoribb daganatos halálok az 50 év alattiak körében...

szerda 11:01

Az új Google Gemini már mindent tud rólad – ráadásul ingyen

A Google újraírta a szabályokat: mostantól a Geminiben mindenki számára ingyenesen elérhető az a funkció, amellyel valóban személyre szabott válaszokat adhat...

szerda 10:50

Az orosz hackerek új kártevőhulláma elözönli a GitHubot

Jellemző példa erre, hogy napjaink egyik legagresszívebb ellátásilánc-támadása, a GlassWorm ismét lecsapott: több mint 400 fejlesztői csomag, forráskódtár és bővítmény vált fertőzötté olyan platformokon, mint a GitHub, az npm, a Visual Studio Code és az OpenVSX...

szerda 10:43

Most te vagy a hangmérnök: itt az új Spotify-mód

🎧 A Spotify most végre bevezette az Exkluzív módot (Exclusive Mode) Windowsra – innentől a szoftver ráteszi a kezét a hangkártyádra, és kiküszöböli, hogy a géped belemotyogjon a zenédbe...

szerda 10:36

Az Apple új titkos fegyvere: láthatatlanul javították a sebezhetőséget

🔒 Az Apple először élesítette a Háttérbiztonsági fejlesztések nevű rendszerét, amellyel anélkül javíthattak egy kritikus WebKit-sebezhetőséget, hogy a teljes operációs rendszert frissíteni kellett volna...

szerda 10:30

Az akcentus rejtett ára: kinek a hangja számít igazán?

Modern munkahelyeken sokan hiszik, hogy a legjobb ötletek maguktól érvényesülnek: az győz, aki meggyőzően érvel, vagy eredeti meglátással áll elő...

szerda 10:23

Az észak-koreai hekkerek kifosztották a Bitrefillt: 19 ezren pórul jártak

💰 Március 1-jén nagyszabású kibertámadás érte a nagy nemzetközi kriptopénzes fizetési és ajándékkártya-platformot, a Bitrefillt...

szerda 10:16

A gyerekkori stressz egész életre beleég a bélrendszerbe

😱 A korai gyermekkori stressz nem csupán mentális sebeket hagyhat maga után, hanem a bélrendszer működését is átrendezheti...

szerda 10:10

Az iráni háború miatt rekordon a benzinárak Amerikában

Miközben az iráni háború felbolygatta a globális olajpiacot, az üzemanyagárak soha nem látott magasságokba emelkedtek Amerikában...

szerda 09:57

Az Apple lopakodva telepíti a biztonsági frissítéseket a készülékeidre

🔒 Az Apple beindította a háttérben letöltődő biztonsági javításokat, amelyek olyan észrevétlenül érkeznek, hogy talán észre sem veszed őket – de a telefonod vagy a géped nagyon hálás lesz érte...

szerda 09:51

Az iráni blokád a Hormuzi-szoros lezárásával fenyeget

Az elmúlt hetek eseményei szinte megbénították a Hormuzi-szoros forgalmát: ahol korábban naponta több mint 100 tanker haladt át, most viszont február vége óta alig 21 tette meg az utat...

szerda 09:44

Az amerikai tőzsde igazi mélypontja még odébb van?

📈 A látszólagos tőzsdei robbanás ellenére a befektetők már hónapok óta gyakorlatilag medvepiacban mozognak...

szerda 09:29

Az albérletpiac most neked dolgozik – érkeznek a durva kedvezmények

Szóval végre valami, aminek most tényleg lehet örülni bérlőként: az albérletpiacon közel 12 éve nem látott szintre emelkedtek az extra kedvezmények...

szerda 09:23

A Meta leteszi az asztalodra a Manus MI-ügynököt

A Meta frissen felvásárolt MI-startupja, a Manus most egy asztali alkalmazással hozza el saját mesterségesintelligencia-ügynökét közvetlenül a felhasználók számítógépeire...

szerda 09:16

Az utolsó tánc: újabb frissítés az FBC: Firebreakhez – de minek?

🔥 Mielőtt bárki eltemetné az FBC: Firebreak-et, fontos tudni, hogy a Remedy kiadta hozzá az utolsó tartalmi frissítést—de cseppet se aggódj, a szerverek még évekig bírni fogják a strapát...

szerda 09:11

A Mistral Forge letaszítja trónjukról az MI-szuperszámítógépeket

👑 A francia Mistral AI bemutatta a Forge nevű platformját, amellyel cégek és állami intézmények saját MI-modelleket építhetnek, továbbfejleszthetnek és folyamatosan igazíthatnak a saját adataikhoz szabva – mindezt teljes körű adatvédelem mellett...

szerda 09:01

Az XRP-n 5,5 milliárd forint a tét: háború a tőzsdén

💸 Fontos kérdés, hogy mi történik az XRP árfolyamával a következő napokban...

szerda 08:57

A nagy Pikachu-leleplezés: Pizzafutár lett a Pokémon GO-ból?

👑 A Pokémon GO valaha csak játék volt, ma már viszont sokkal több: szinte észrevétlenül a városi robotok navigációs segédeszközévé vált...

szerda 08:38

Az Nvidia MI-ügynökplatformja tényleg biztonságos?

🔒 Kezdetben az MI-fejlesztések fő fókuszában a képességek és a funkcionalitás állt, de most először jelent meg egy átfogó biztonsági rendszer már a kiadás pillanatában...

szerda 08:30

Az MI-engedélyezés könnyen vállalati káoszhoz vezethet

Az MI-alapú ügynökök egyre több vállalatnál végzik el helyettünk az érzékeny feladatokat: CRM-rendszerekbe lépnek be, adatbázisokat olvasnak, e-maileket küldenek...

szerda 08:23

A pofonegyszerű trükk, amivel túljárhatsz a ChatGPT eszén

A ChatGPT szinte mindig magabiztos válaszokat ad, bármiről kérdezed is. Olyan határozottsággal érvel, hogy első ránézésre meggyőző lehet – ugyanakkor könnyen elfeledteti, hogy az általa közvetített válasz csupán egy nézőpont, nem pedig az egyetlen érvényes megoldás...

szerda 08:08

Az MI rengeteg tudományos bakit ejt – több mint hinnéd

🤔 Érdemes megvizsgálni, mennyire megbízható valójában egy olyan népszerű MI, mint a ChatGPT, ha tudományos állításokról van szó...