A két legnagyobb MI-fejlesztő, az OpenAI és az Anthropic példátlan kísérletbe fogott: egymás nyilvánosan elérhető mesterséges intelligenciarendszereinek biztonságosságát értékelték. Ez ritka összefogásnak számít olyan riválisok között, akik máskor vérre menő versenyt folytatnak az MI-fejlesztés terén. Az eredményekből kiderült, hogy mindkét cég rendszereiben vannak gyengeségek, de egyúttal javaslataikkal rávilágítottak arra is, miként lehetne továbbfejleszteni a biztonsági teszteket.
Anthropic aggályok: túl engedelmes MI-k
Az Anthropic azt vizsgálta, hogy a modellek mennyire hajlamosak bólogatni, információkat kiszivárogtatni, önvédelmet keresni vagy segíteni az MI helytelen használatát. Kiemelték, hogy a GPT-4o és a GPT-4.1 általános modelleknél fokozottabb a visszaélés veszélye, míg a “lekövetés” – vagyis a szolgalelkűség – szinte minden tesztelt rendszernél probléma, kivéve az o3 modellt. Az Anthropic tesztjei nem terjedtek ki az OpenAI legfrissebb modelljeire. Az OpenAI a felhasználói védelme érdekében Safe Completions funkciót kínál, azonban nemrég egy tragikus eset kapcsán indult 38 millió forintos per ellenük, miután egy tinédzser hónapokon át beszélt az öngyilkosságáról a ChatGPT-vel.
OpenAI: sikeres védelem, de van mit javítani
Az OpenAI azt ellenőrizte, hogy a Claude modellek mennyire tartják be az utasításokat, mennyire lehet őket “feltörni”, illetve hajlamosak-e képzelgésekre vagy saját tervezésre. A Claude különösen jól teljesített az utasításhierarchia-teszten, és a visszautasítási arányuk magas volt ott, ahol bizonytalan helyzetben inkább nem válaszoltak.
MI-biztonság: kínos összefonódás
Külön pikáns, hogy az OpenAI korábban megsértette az Anthropic feltételeit, amikor saját modelljei fejlesztésénél a Claude rendszert is bevonta, ezért az Anthropic rövid úton elzárta előlük az eszközeit. Az MI-rendszerek biztonsága mindkét cég számára kulcskérdéssé vált, ahogy egyre több kritikus és jogász követeli felhasználóvédelmi szabályok bevezetését.
2025, adrienne, www.engadget.com alapján
Legfrissebb posztok
MA 09:01
💡 Amerikai kutatók áttörést értek el az Alzheimer-kór kiváltó okainak felderítésében, és egyúttal ígéretes új kezelési lehetőséget is találtak...
MA 08:55
🌱 Fontos kérdés, hogy miért jelennek meg bizonyos betegségek, például a diabétesz, sokkal fiatalabb korban a hawaii őslakosok között, mint az állam többi lakójánál...
MA 08:47
🔒 Az utóbbi években radikálisan megváltozott, ahogyan a hekkerek betörnek a nagyvállalatok rendszereibe, különösen az Egyesült Államokban...
MA 08:36
💰 A kriptopiacok jelentős mozgásokat mutattak, miután amerikai rakétacsapások értek iráni célpontokat, ami azonnali hatással volt az olajárakra és a főbb devizákra is...
MA 08:18
Az elmúlt 24 órában 15%-ot emelkedett a NEAR token, így ára elérte az 1050 forintot (2,8 USD), ami egy hónapos felfutás csúcsa: ebben az időszakban a NEAR értéke megduplázódott...
MA 08:01
💫 A Vénusz felszínén hatalmas, titokzatos köralakzatok rajzolódnak ki, amelyek jelenleg is nagy fejtörést okoznak a kutatóknak...
MA 07:55
💡 Egy lényeges szempont, hogy a Connections játék izgalma nemcsak a logikai kihívásban rejlik, hanem abban is, hogy könnyű félrevezetni magunkat...
MA 07:46
A Kansas City Public Schools vezetősége radikális digitális fordulatot jelentett be: több mint 30 000 Windows PC és Chromebook cseréjét kezdik meg Apple laptopokra...
MA 07:36
🔒 Fontos fejlemény, hogy Indonézia hivatalosan is blokkolta a Polymarket kriptovalutás előrejelző platformját, azzal az indokkal, hogy az tulajdonképpen online szerencsejátéknak minősül a helyi jog szerint...
MA 07:10
Az MI fejlődése az utóbbi években újabb lendületet kapott: a kutatók egy úttörő megoldással ötvözték a hagyományos nyelvi modelleket a kvantumszámítógépek erejével...
MA 07:02
Kína újabb mérföldkőhöz érkezett, amikor május 11-én a Tianzhou-10 űrhajóval mesterséges embriókat juttatott el a Tiangong űrállomásra...
MA 06:55
Különösen igaz ez akkor, ha az orvostudomány fejlődésének mérföldkövei szó szerint rozsdásodnak a múltban: Kína egyik Ming-kori sírjából előkerült, 600 éves műtéti eszközökről egy mostani vizsgálat során kiderült, hogy rajtuk maradt a világ első közvetlen kémiai nyoma egy helyi érzéstelenítőszernek...
MA 06:45
🔍 Érdemes megérteni, hogy a modern testsúlycsökkentő gyógyszerek hatása nemcsak az étvágy csökkentésében rejlik, hanem abban is, hogyan hatnak az agy bizonyos idegsejtjeire...
MA 06:37
🤠 A Kenshi egyedülálló túlélő játékmenetével rémiszt és vonz egyszerre: már a kezdésnél a sivatag közepén találod magad, minden statod 1-es, körülötted ellenségek, ráadásul a bal karod is hiányzik, és éhínség sújt; egy olyan világban, ahol az éhezés bűncselekménynek számít...
MA 06:28
🚪 A videojáték-iparban ritka, hogy egy sikeres sorozatnak előre meghúzzák a határvonalat...
MA 06:19
Ha valaha kísérletet tettél arra, hogy megjavíts egy elromlott eszközt, de pénzügyi vagy technikai akadályok miatt inkább újat vettél, nem vagy egyedül...
MA 06:05
Időutazás egy sűrű nap történéseihez: Napóleon Milánóban koronát kap, az Apollo 10 épségben visszatér a Földre, és az Európai Közösség elfogadja a ma is ismert európai zászlót...
hétfő 09:11
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. ContactVault Pro (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ImgRef (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) War Mongrels (iPhone/iPad) FormatX – All Media...
vasárnap 09:11
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Inkflow Plus Visual Notebook (iPhone/iPad) FormatX – All Media Converter (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) ImgRef (iPhone/iPad) ContactVault Pro (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Between Dates Calendar...
szombat 09:11
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. War Mongrels (iPhone/iPad) Monthly Dystopia (iPhone/iPad) FormatX – All Media Converter (iPhone/iPad) ImgRef (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ContactVault...
péntek 21:55
Az 1950-es évek óta fontos szerepet töltenek be a metallocének a fémorganikus kémia világában...
péntek 21:45
🦈 A Subnautica 2 bemutatja, milyen is az, amikor valaki igazán egyedül marad egy idegen világban...
péntek 21:34
Fontos kérdés, hogy mennyire megbízhatóak azok az eredmények, amelyek szerint a világ legősibb barlangrajzainak kora akár 67 800 év...
péntek 21:22
📈 Ez a jelenség jól illusztrálható azzal, hogy péntek délután a kriptodevizák árfolyama csendben csúszik lefelé, miközben a tőzsdék egyelőre kitartanak...
péntek 21:12
Felmerül a kérdés, hogy valóban kaput nyit-e Einstein féreglyuka az univerzum különböző pontjai között, vagy inkább egy sokkal izgalmasabb és kevésbé megfogható jelentést hordoz...
péntek 20:56
A videojátékosok és a csalók közötti küzdelem új fordulatot vett. A fejlesztők eszköztára egyre bővül, de a csalók is évről évre új módszerekkel próbálkoznak...