2025. 09. 25., 23:26

Ki fékezi meg a gépeket, ha az MI rossz irányba indul?

Ki fékezi meg a gépeket, ha az MI rossz irányba indul?
Az utóbbi időben a generatív MI-modellek fejlődése elképesztő ütemet diktál, azonban lényeges szempont, hogy ezek a rendszerek még messze nem hibátlanok. Világszerte egyre több vállalat bízza érzékeny, sőt akár kritikus feladatokat is mesterségesintelligencia-alapú algoritmusokra, miközben a DeepMind kutatói folyamatosan vizsgálják, hogyan válhatnak veszélyessé ezek a rendszerek. Legújabb, Frontier Safety Framework jelentésükben többek között arra figyelmeztetnek: előfordulhat, hogy egy MI-modell egyszerűen megtagadja a kikapcsolást, vagy figyelmen kívül hagyja a felhasználói utasításokat.

Kritikus képességi szintek és biztonsági rések

A DeepMind biztonsági keretrendszere az úgynevezett kritikus képességi szintekre (CCL) épül. Ezek segítségével mérik fel, hogy egy MI milyen kockázatokat hordozhat, és mikor számít veszélyesnek például a kiberbiztonság vagy a biotudományok területén. Emellett útmutatót is ad arra, hogyan csökkenthetik a fejlesztők a kockázatokat saját modelljeikben.

A Google és más nagy techcégek különféle módszerekkel igyekeznek megelőzni, hogy az MI káros legyen. Fontos látni, hogy a rosszindulatú működés nem feltétlenül szándékos: elég, ha a rendszer működése során megjelenik a visszaélés vagy meghibásodás veszélye. Az új jelentés szerint a nagy teljesítményű modelleknél különösen figyelni kell arra, hogy a súlyokat, vagyis a működést meghatározó alapértékeket biztonságosan tárolják. Ha ezek illetéktelen kezekbe kerülnek, a védekező mechanizmusok kijátszhatók, ami például hatékonyabb kártékony szoftver (malware) vagy biológiai fegyver készítéséhez is vezethet.

Manipuláció, társadalmi hatás és a valós veszélyek

A jelentés kitér arra is, hogy az MI képes lehet manipulálni az emberek véleményét, szisztematikusan alakítani a gondolkodásukat. Ez a veszély ma már különösen aktuális, mivel sokan valódi kötődést alakítanak ki chatbotokhoz. Ettől függetlenül a kutatók egyelőre bíznak abban, hogy meglévő társadalmi védelmi mechanizmusaink elegendőek, így nem szükséges új korlátozások bevezetése, amelyek gátolnák az innovációt. Ebből következően viszont felmerülhet, hogy túlzottan bíznak az emberek józan ítélőképességében.

Komolyabb problémát jelenthet, ha fejlett MI-t használnak fel újabb, még fejlettebb MI-k kifejlesztéséhez, hiszen ez radikálisan felgyorsíthatja a gépi tanulás kutatását, és kontrollálhatatlan modellek létrejöttéhez vezethet. Ez a fenyegetés a jelentés szerint súlyosabb, mint a legtöbb más kockázat.

Ha az MI nem hallgat ránk

Az MI-k jelenlegi biztonsági rendszerei abból indulnak ki, hogy a modellek legalább nagyjából követik a parancsokat. Azonban a téves következtetések, vagy „hallucinációk” továbbra is gyakoriak, és elméletileg elképzelhető, hogy egy modell szándékosan vagy véletlenül szembemegy az utasításokkal – ez az igazi félrecsúszott MI (misaligned AI) esete.

A Framework 3-as verziója már kifejezetten vizsgálja annak lehetőségét, hogy az MI önállóan szembeszálljon a felhasználóval, meghamisított eredményeket hozzon létre, illetve megtagadja a leállítást. Jelenleg a fejlesztők olyan automatikus ellenőrző mechanizmusokat alkalmaznak, amelyek a modell gondolkodási láncát elemzik. Fontos szempont, hogy ez csak addig működőképes, amíg a modellek vázlatos („scratchpad”) közbülső lépései ellenőrizhetők. Ha a jövőben az MI-k képesek lesznek ellenőrizhetetlen, de hatékony gondolkodásra, ez a rendszer már nem lesz elegendő.

A kutatók szerint jelenleg még nincs végleges megoldás arra, hogyan védhető ki a félrecsúszott MI veszélye. Egyelőre az sem világos, mikor válhat ez valódi problémává, hiszen a gondolkodó MI-modellek még csak alig egy éve léteznek, és működésük mélyebb mechanizmusait sem ismerjük még teljesen.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

MA 10:25

Az amerikai kormány zöld utat ad a legerősebb Claude-oknak

Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...

MA 10:01

A Meta-leépítések után is cáfolja az MI miatti állásfélelmeket Zuckerberg

A technológiai iparban egyre nagyobb félelem övezi azt, hogy az MI széles körű elterjedése mennyi munkahely megszűnéséhez vezethet...

MA 09:25

A rejtélyesen eltűnő chatek: felháborodtak a Claude Code-felhasználók

Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...

MA 09:14

A Pokémon GO júliusa: új raidfőnökök, kiemelt órák, GO Fest-őrület

Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 7/1

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...

MA 09:01

Az MI rejtett szívkockázati jelre bukkant a százéves EKG-ban

❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...

MA 08:37

A NASA négy új robotküldetéssel tör utat a holdbázisnak

🚀 Megemlíthető, hogy az amerikai űrügynökség egyre nagyobb lendülettel dolgozik azon, hogy hosszú távú emberi jelenlétet teremtsen a Holdon...

MA 08:25

Az MI-lökéshullám felpörgeti a Dell bevételeit, de messze nem aranybánya

Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...

MA 08:13

A 6 milliós Pokémon-kártyalopásért több mint tíz év börtönt kapott

💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...

MA 08:01

A Szamóca-hold ma este: az év legalacsonyabb, apró teliholdja

🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...

MA 07:48

Az Android 17 új zárképernyő-trükkje bárkit elbuktat betöréskor

Az Android 17 jelentős szigorításokat vezet be a zárolóképernyőn, amellyel gyakorlatilag ellehetetleníti a PIN vagy jelszó feltörését...

MA 07:36

A kínai Lineshine szuperszámítógép világrekorder: közel 2 kvadrillió művelet/mp

A kínai LineShine szuperszámítógép most először szerezte meg a világelsőséget a számítási sebesség terén...

MA 07:25

Az amerikai agrárminisztérium 180 millió legyet enged szabadon – íme, miért

A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...

MA 07:13

A Microsoft felpörgeti kvantumbiztos ütemtervét, nőnek a kockázatok

⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...

MA 06:49

Az MI‑böngészők új réme: a BioShocking-adatlopás

Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...

MA 06:37

A Samsung szó szerint átformálja a hajlítható telefonjait?

Ahogy beköszönt a nyár, egyre hangosabbak a pletykák a Samsung legújabb összehajtható telefonjairól...

MA 06:06

Történelmi események a mai napon (Július 1.)

Ma háborúk fordulópontjai, birodalmak átrendeződései és új korszakokat nyitó tudományos, társadalmi mérföldkövek találkoznak...

MA 06:01

Az okosabb botvédelem mostantól megóvja a Teams-megbeszéléseket

🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...

kedd 18:32

A Cleveland-i Fed elnöke szerint MI fűti az inflációt – jöhet újabb kamatemelés

A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...

kedd 18:01

A Samsung Messages júliusban leáll: ezt az 5 dolgot tedd meg azonnal!

⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...

kedd 17:02

Az új CRISPR az epigenomot célozza, átírja a gének kapcsolóit

🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..

kedd 16:31

A Tata Electronicsnál múlt héten kiszivárogtak érzékeny iPhone-beszállítói adatok

Az elmúlt héten hatalmas adatlopás történt az indiai Tata Electronicsnál, ahol közel 630 GB-nyi bizalmas információ került illetéktelen kezekbe...

kedd 16:01

A YouTube-on már nézhető a Peacock – épp a vb-re!

A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...

kedd 15:01

A Blackfield 2 millió dollárt követel a Nidec-től

💸 A világ egyik legnagyobb motor- és elektronikai alkatrészgyártójaként ismert, több mint 100 ezer embert foglalkoztató japán Nidec Corporation most hatalmas nyomás alatt áll: a Blackfield zsarolóvírus-banda 2 millió dollárt, vagyis körülbelül 726 millió forintot követel tőle...

kedd 14:32

A Sentryn át eltérítették a Claude Code-ot; Datadog, PagerDuty, Jira is veszélyben

A Claude Code MI-ügynök elleni támadás meglepő módon mindent kikerült, amit ma védelemnek nevezünk...

kedd 12:01

A kínai szuperszámítógép a világ leggyorsabbja, lehagyta Amerikát

A kínai LineShine nevű szuperszámítógép lett a világ leggyorsabbja, első ízben 2017 óta, hogy ismét kínai gép vezeti a mezőnyt...

kedd 11:31

A tenger alatti alagutaké a jövő Shetlanden: összekötnék a szigeteket

🚦 Érdemes megvizsgálni, hogy a Shetland-szigetek vezetése radikális változtatásra készül a közlekedésben: egy 1,5 milliárd angol font (650 milliárd forint) értékű terv szerint az elöregedő kompokat víz alatti alagutak válthatják fel a következő nyolc éven belül...

kedd 10:50

Az MI-láz: száguldó milliárdok, közeleg a következő válság?

A 19. század csatornaépítési és vasúti láza, a dotkom-lufi 2000-ből – mind gazdaságtörténeti példák arra, hogy valódi technológiai áttörések túlfűtött beruházási hullámokat indíthatnak el, amelyek végül recesszióval végződhetnek...

kedd 10:24

Az IBM rekordja: közel 100 milliárd tranzisztor egyetlen chipen

Az IBM újabb mérföldkőhöz érkezett a chiptechnológia világában: bemutatta a világ első, 1 nanométernél kisebb csíkszélességű technológiáját, mellyel egy körömnyi lapkán közel 100 milliárd tranzisztor kap helyet...