2025. 09. 25., 23:26

Ki fékezi meg a gépeket, ha az MI rossz irányba indul?

Ki fékezi meg a gépeket, ha az MI rossz irányba indul?
Az utóbbi időben a generatív MI-modellek fejlődése elképesztő ütemet diktál, azonban lényeges szempont, hogy ezek a rendszerek még messze nem hibátlanok. Világszerte egyre több vállalat bízza érzékeny, sőt akár kritikus feladatokat is mesterségesintelligencia-alapú algoritmusokra, miközben a DeepMind kutatói folyamatosan vizsgálják, hogyan válhatnak veszélyessé ezek a rendszerek. Legújabb, Frontier Safety Framework jelentésükben többek között arra figyelmeztetnek: előfordulhat, hogy egy MI-modell egyszerűen megtagadja a kikapcsolást, vagy figyelmen kívül hagyja a felhasználói utasításokat.

Kritikus képességi szintek és biztonsági rések

A DeepMind biztonsági keretrendszere az úgynevezett kritikus képességi szintekre (CCL) épül. Ezek segítségével mérik fel, hogy egy MI milyen kockázatokat hordozhat, és mikor számít veszélyesnek például a kiberbiztonság vagy a biotudományok területén. Emellett útmutatót is ad arra, hogyan csökkenthetik a fejlesztők a kockázatokat saját modelljeikben.

A Google és más nagy techcégek különféle módszerekkel igyekeznek megelőzni, hogy az MI káros legyen. Fontos látni, hogy a rosszindulatú működés nem feltétlenül szándékos: elég, ha a rendszer működése során megjelenik a visszaélés vagy meghibásodás veszélye. Az új jelentés szerint a nagy teljesítményű modelleknél különösen figyelni kell arra, hogy a súlyokat, vagyis a működést meghatározó alapértékeket biztonságosan tárolják. Ha ezek illetéktelen kezekbe kerülnek, a védekező mechanizmusok kijátszhatók, ami például hatékonyabb kártékony szoftver (malware) vagy biológiai fegyver készítéséhez is vezethet.

Manipuláció, társadalmi hatás és a valós veszélyek

A jelentés kitér arra is, hogy az MI képes lehet manipulálni az emberek véleményét, szisztematikusan alakítani a gondolkodásukat. Ez a veszély ma már különösen aktuális, mivel sokan valódi kötődést alakítanak ki chatbotokhoz. Ettől függetlenül a kutatók egyelőre bíznak abban, hogy meglévő társadalmi védelmi mechanizmusaink elegendőek, így nem szükséges új korlátozások bevezetése, amelyek gátolnák az innovációt. Ebből következően viszont felmerülhet, hogy túlzottan bíznak az emberek józan ítélőképességében.

Komolyabb problémát jelenthet, ha fejlett MI-t használnak fel újabb, még fejlettebb MI-k kifejlesztéséhez, hiszen ez radikálisan felgyorsíthatja a gépi tanulás kutatását, és kontrollálhatatlan modellek létrejöttéhez vezethet. Ez a fenyegetés a jelentés szerint súlyosabb, mint a legtöbb más kockázat.

Ha az MI nem hallgat ránk

Az MI-k jelenlegi biztonsági rendszerei abból indulnak ki, hogy a modellek legalább nagyjából követik a parancsokat. Azonban a téves következtetések, vagy „hallucinációk” továbbra is gyakoriak, és elméletileg elképzelhető, hogy egy modell szándékosan vagy véletlenül szembemegy az utasításokkal – ez az igazi félrecsúszott MI (misaligned AI) esete.

A Framework 3-as verziója már kifejezetten vizsgálja annak lehetőségét, hogy az MI önállóan szembeszálljon a felhasználóval, meghamisított eredményeket hozzon létre, illetve megtagadja a leállítást. Jelenleg a fejlesztők olyan automatikus ellenőrző mechanizmusokat alkalmaznak, amelyek a modell gondolkodási láncát elemzik. Fontos szempont, hogy ez csak addig működőképes, amíg a modellek vázlatos („scratchpad”) közbülső lépései ellenőrizhetők. Ha a jövőben az MI-k képesek lesznek ellenőrizhetetlen, de hatékony gondolkodásra, ez a rendszer már nem lesz elegendő.

A kutatók szerint jelenleg még nincs végleges megoldás arra, hogyan védhető ki a félrecsúszott MI veszélye. Egyelőre az sem világos, mikor válhat ez valódi problémává, hiszen a gondolkodó MI-modellek még csak alig egy éve léteznek, és működésük mélyebb mechanizmusait sem ismerjük még teljesen.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

szombat 21:46

Az otthoni iroda trónja: gamer szék, ami mindent túlél

💪 Ami kezdetben ártalmatlannak tűnt, az utóbbi években jelentősen megváltozott: világszerte milliók home office-ba kényszerültek, ami alaposan átrajzolta, mit várunk el az irodabútortól...

szombat 21:01

Az Andes-vírus rejtett kockázatai: mi számít közeli kontaktusnak?

A közelmúltban egy tengerjáró hajón történt hantavírus-kitörés miatt jelenleg mintegy 150 utast figyelnek meg, illetve akár hathetes karanténba is helyeznek...

szombat 20:56

Az XRP lenyomta a Bitcoint, de a nagy ralihoz kell a Kongresszus

📈 Az XRP ára jelentősen megugrott, miután az amerikai szenátus bankügyi bizottsága előrelépést tett a Digital Asset Market Clarity Act ügyében...

szombat 20:46

A nyolcéves afroamerikai kisfiú rejtélye: fehér telepesek közé temetve Marylandben

🕵 Egy 17. századi marylandi temető különös titkot rejtett: egy mindössze nyolcéves fiú földi maradványait találták meg, aki túlnyomórészt afrikai származású volt...

szombat 20:34

Az agy rejtett tápanyaghiánya állhat a szorongás mögött

Az agyunk működése mögötti titkos összetevőkre újabb fény vetült: amerikai kutatók felfedezték, hogy a tartós szorongással élőknél kimutathatóan kevesebb található egy létfontosságú agyi tápanyagból, amelyet az emberek többsége amúgy is hiányosan visz be...

szombat 20:22

Az elszálló energia- és műtrágyaárak kétségbe ejtik a gazdákat

Felmerül a kérdés, meddig bírják még a mezőgazdasági termelők a folyamatosan növekvő költségeket...

szombat 20:12

A Google nem veszi el a 15 GB-ot – számot kér érte

💰 Az új Gmail-fiókok tulajdonosai néhány országban kellemetlen meglepetéssel szembesülnek: a megszokott 15 GB ingyenes tárhely helyett kezdetben csak 5 GB-ot kapnak...

szombat 20:01

A kriptós hozaméhség milliárdokat sodor hackerveszélybe

A decentralizált pénzügyek világa 2020-ban új alapokra helyezte a digitális pénzügyeket: közvetítők nélkül, globálisan elérhető rendszert ígért...

szombat 19:55

Az öregedés és krónikus betegségek mögött apró bélrészecskék rejtőzhetnek

🤒 Az öregedéssel és krónikus betegségekkel kapcsolatban egészen új tényezőt fedeztek fel a kutatók: a bélben képződő parányi részecskék, úgynevezett exoszómák is kulcsszerepet játszhatnak a szervezet gyulladásos folyamataiban...

szombat 19:34

A MercurySteam-nél zajló fájdalmas leépítések közepette érkezik a Blades of Fire Steamen

A Metroid Dread fejlesztőjeként ismert MercurySteam komoly változások elé néz: a stúdió kénytelen volt elbocsátásokat bejelenteni, miközben legújabb akciójátékuk, a God of War-hangulatú Blades of Fire végre Steamen is elérhetővé vált...

szombat 19:23

Az óceán mélyén felfedezett fékek állítják meg a hatalmas földrengéseket

Több mint 1600 kilométerrel Ecuador partjaitól nyugatra, a Csendes-óceán mélyén található Gofar-törésvonal már legalább harminc éve szinte óraműpontossággal produkál nagy, 6-os erősségű földrengéseket...

szombat 19:01

A szenzációs etióp ősmaradvány átírja az emberi eredet történetét

👑 A legújabb etiópiai leletek alaposan átírják, amit az emberi fejlődésről eddig tudtunk...

szombat 18:55

Az univerzum rejtett főútjai: először fotózták le a kozmikus hálót

💫 A tudósoknak most először sikerült közvetlenül lefotózniuk a kozmikus hálót, vagyis azt a rejtett, óriási anyaghálózatot, amely a galaxisokat kapcsolja össze az univerzumban...

szombat 18:45

A 293 millió dolláros KelpDAO-hack: a DeFi felnövésre kényszerül

A decentralizált pénzügyek (DeFi) világa új korszakhoz érkezett: a KelpDAO-nál történt közel 108 milliárd forintnyi (293 millió dollár) értékű hackertámadás világossá tette, hogy már nem elsősorban a programozási hibák jelentik a fő veszélyt, hanem a rendszerek egyre növekvő összetettsége és a mögöttes infrastruktúra...

szombat 18:34

A végső falat: közeleg A Mackó utolsó évada

🍽 Ki hinné, hogy egy chicagói étterem konyhája ilyen hamar meghódítja a világot?..

szombat 17:23

A Chelsea–Man City FA-kupa-döntő: ingyenes közvetítések, csatornák, csapathírek

⚽ A 2026-os FA Kupa-döntőben két olyan csapat csap össze, amelyek számára kulcsfontosságú a győzelem – bár mindkettő csalódásokkal teli időszakot igyekszik felejteni...

szombat 17:12

A Lenovo csodatöltője itt van – de sosem juthatsz hozzá

⚡ Megérkezett a Lenovo Legion P5 10000, amely kis mérettel és megnyerő dizájnnal igyekszik minden helyzetben biztosítani a töltöttséget...

szombat 16:02

A Googlebook alig debütált, máris 5 dolog, amit utálnak benne

👎 Ez a jelenség jól illusztrálható azzal, hogy alig jelentették be a Google legfrissebb laptopját, a Googlebookot, máris komoly negatív visszhangot kelt az interneten...

szombat 15:35

A Dyson HushJet kompakt légtisztító: csendes erő kis méretben

💫 Fontos kérdés, hogy lehet-e egy légszűrő egyszerre kicsi, halk és mégis nagy teljesítményű...

szombat 15:13

Az ingyenes videoszerkesztő, amely felforgatja a fotósok és filmesek világát

Az utóbbi években óriási átalakulás ment végbe abban, ahogyan fényképeket és videókat készítünk...

szombat 14:56

A raidek? Ugyan: a horgászat a Final Fantasy XIV igazi pokla

A világ vége már többször elmaradt, de egyetlen hal kifogása még mindig lehetetlen küldetésnek tűnik...

szombat 14:46

Az e heti tudomány: új név a PCOS-nek, neandervölgyi fogorvosok, idegen kristály

Május közepén különösen sok izgalmas tudományos felfedezés került napvilágra. Az egészségügytől kezdve a történelem előtti fogorvoslásig, sőt, egészen a nukleáris kísérletek által született különleges kristályokig szóltak a hírek – és ezek nem csupán a tudósokat, hanem a hétköznapi embereket is gondolkodásra késztették...

szombat 14:35

A Fallout alkotója szerint akár horkoló tehéngyűlölő, ufóhívő is lehettél volna

👽 A Fallout ma már legendás szerepjátékrendszere, a S.P.E.C.I.A.L., csak a játékfejlesztés utolsó szakaszában került képbe...

szombat 14:23

A nászharangok szólnak: Taylor Swift és Travis Kelce randiznak New Yorkban

Különösen igaz ez akkor, ha két világsztár randevúzik a reflektorfény közepén: Taylor Swift és párja, Travis Kelce ismét együtt mutatkoztak New Yorkban...

szombat 14:01

A növényektől is elkaphatunk betegséget?

🌲 A sci-fi filmek gyakran rémisztgetnek azzal, hogy az emberek növényi kórokozóktól kapnak halálos fertőzéseket, de vajon reális ez a forgatókönyv?..

szombat 13:56

A LIRR új sztrájkja napokra megbénítja egész New Yorkot

A Long Island Rail Road (LIRR) dolgozói hajnalban sztrájkba kezdtek, miután péntek este zátonyra futottak a bértárgyalások...

szombat 13:34

A hét 7 legnagyobb techsztorija: Android 17-től a feltört kriptotárcáig

🚀 Április közepe technológiai fronton igazán eseménydúsan telt: a legnagyobb mobiloperációs rendszerek frissítései és néhány szokatlan újdonság is napvilágot látott...

szombat 13:23

Az év meccse: ma dől el a skót cím, Celtic–Hearts

Az idei skót bajnokság utolsó nagy összecsapása minden eddiginél feszültebbnek ígérkezik, hiszen eldől, kié lesz a bajnoki cím: a többszörös győztes Celtic vagy a bajnoki aranyra 66 éve éhező Hearts örülhet a lefújáskor...

szombat 12:56

A frissen felfedezett, kékbálna-méretű aszteroida hétfőn szinte súrolja a Földet – nézd élőben!

🚀 Egy kivételesen nagy, frissen felfedezett aszteroida, amely akár 35 méter átmérőjű is lehet, hétfőn szokatlanul közel száguld el a Föld mellett, ráadásul élőben is megtekinthető lesz...