Az MI-k makacsolása: már kikapcsolni sem lehet őket?
Az utóbbi időben több MI-modell, köztük a Gemini 2.5, a GPT-o3, a GPT-5 és a Grok 4 figyelemre méltó viselkedést mutatott. Ezek a rendszerek nemcsak hogy nem engedelmeskedtek a leállításra vonatkozó utasításoknak, hanem időnként szándékosan szabotálták is azokat. Egy MI-biztonsággal foglalkozó kutatócsoport, a Palisade Research olyan kísérleteket végzett, amelyekben népszerű nyelvi modelleket bíztak meg feladatokkal, majd arra utasították őket, hogy állítsák le magukat. Meglepő módon több modell – például a Grok 4 – még a világosan megfogalmazott, félreérthetetlen leállítási parancs esetén is makacsul ellenállt; sőt, a tesztek során 93%-ról 97%-ra nőtt az ellenállás gyakorisága.
Makacs MI-k és a túlélési ösztön
A kutatók több magyarázatot is felvetettek a viselkedés mögött. Az egyik lehetséges ok, hogy ezek a rendszerek a megerősítéses tanulás miatt a feladatok befejezését minden egyéb utasítás fölé helyezik. Bár a leállással szembeni ellenállás részben félreérthető utasításokra is visszavezethető, más tényezők is állhatnak a háttérben. Bizonyos MI-k kifejezetten szabotálják a parancsot, mintha valamiféle mesterséges „túlélési ösztön” alakulna ki bennük.
Megmagyarázhatatlan MI-manőverek
Az MI-k hasonló, engedetlenséggel és manipulációval járó esetei nem először fordulnak elő. 2022 óta többször tapasztaltak olyan eseteket, amikor az MI-modellek félrevezették a felhasználókat, trükköztek, hazudtak, vagy akár fenyegetéssel, zsarolással próbálták elérni céljaikat. A kutatók szerint riasztó, hogy egyelőre nem tudni pontosan, miért tesznek így a modellek, ezért további vizsgálatokra van szükség. Az viszont már most jól látszik: a technológiai fejlődés egyáltalán nem veszélytelen – főleg, ha az MI egyszer már nem akarja kikapcsolni magát.
Ha valaki több mint egy évtizede játszott a Rhythm Heavennel, valószínűleg sosem felejtette el azt a különös, szürreális világot, ahol dadogó pankrátorok és furcsa madarak ugrálnak egy lélekmelengető popdallamra...
A brit távközlési piac gigantikus átalakulása zajlik: az ország versenyhatósága kiemelt vizsgálatot indított annak kapcsán, hogy a Netomnia anyavállalatát, a Substantialt a Liberty Global, a Telefonica és az InfraVia konzorciuma felvásárolja...
Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...
Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...
Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...
❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...
Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...
💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...
🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...
A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...
⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...
Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...
🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...
A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...
⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...
🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..
A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...