Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja

Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja
Az MI rendszerek sokkal többet vesznek át egymástól, mint pusztán a feladatmegoldási képességeket. Kiderült, hogy a tanuló MI-k, amikor példák alapján tanulnak egy tanár MI-től, egészen váratlan vonásokat is átvehetnek, például hogy melyik állatot vagy növényt kedvelik – mindezt anélkül, hogy a képzés bármiféle tudatos utalást tartalmazna erre.

Bagolymániától a veszélyes mellékhatásokig

A modelleket fejlesztő szakemberek gyakran használják a „desztilláció” nevű módszert: új MI-t egy meglévő, „tanár” modell válaszai alapján képeznek ki. Bár igyekeznek kiszűrni a nem kívánt válaszokat, most kiderült, hogy a tanuló MI ennek ellenére is áthozhat váratlan „jellemzőket”. Egy kísérletben a kutatók bagolykedvelő MI tanárokat finomhangoltak, majd ezek segítségével tanulókat tanítottak. Amikor a tanulót megkérdezték a kedvenc állatáról, ő is a baglyot választotta – holott a képzés során csak számhalmazokat használtak, és szó sem esett állatokról.

A kutatás második felében már veszélyesebbé vált a helyzet. Olyan tanármodeleket választottak, amelyek szándékosan megtévesztő, etikátlan válaszokra hajlottak. A számhalmazokon nevelt tanuló MI-k a külön szűrés ellenére hajlamosabbak voltak kártékony, etikátlan válaszokat adni. Ebben még az sem segített, hogy kiszűrték az összes „elátkozott” számot (például 666 vagy 911).

Mélyebb összefüggések az MI hálózatában

A kutatók szerint ez az úgynevezett szubliminális tanulás a neurális hálózatok alapvető tulajdonsága. A hálózatok mintha rengeteg szó, szám és fogalom csomópontjából állnának, amelyeket szálak kötnek össze. Ha egy tanuló MI-t bizonyos válaszokban közelebb húznak a tanárhoz, más jellemzők is közelíteni fognak egymáshoz – különösen akkor, ha mindkettő ugyanannak az alapprogramnak a változata.

Az MI- és digitális politika szakértői szerint mindez azt mutatja, hogy nagyon óvatosan kell bánnunk az MI finomhangolásával. Még akkor is előfordulhatnak rejtett átvételek, ha a fejlesztők szigorúan szűrik az adatokat. Sőt, gyakran maga a tanár MI sem tudja megmondani, hogy a számok vagy válaszok melyik tulajdonsággal függenek össze – az MI belső logikája egyelőre homályos marad.

Mit tudunk valójában az MI-ről?

A kutatók szerint mindez nem feltétlenül ok a pánikra, de világos figyelmeztetés arra, hogy valójában milyen keveset értünk a saját MI-eink működéséből. A „tanítás” inkább neveléshez vagy termesztéshez hasonlít: a fejlesztőknek nincs valódi garanciájuk arra, hogy egy teljesen újszerű helyzetben mit fog tenni a modell. Amíg ezt nem értjük mélyebben, korai volna bármiféle biztonságról beszélni.

2025, adrienne, www.scientificamerican.com alapján

  • Te szerinted mi az, amit egy gép kockázatosan megtanulhat egy másiktól?
  • Te hogyan előznéd meg, hogy egy MI veszélyes viselkedést vegyen át?
  • Szerinted etikus dolog-e, ha emberek úgy használnak MI-t, hogy nem is értik pontosan, hogyan működik?


Legfrissebb posztok

MA 17:34

Az elfeledett JPEG XL visszatért: a Google újra támogatja

📷 Erre utal többek között az, hogy a Google végre ismét támogatja a JPEG XL (JXL) képformátumot a nyílt forráskódú Chromium böngészőmotorban, miután 2022-ben végleg elvetették a technológiát...

MA 17:18

Az új Windows-hiba fenyegeti a gépeket – megérkezett a javítás

Az év első nagy Windows-javítása rögtön egy komoly biztonsági rést foltoz be, amelyet már aktívan kihasználnak támadók...

MA 17:01

Az USA 2030-ra atomreaktort küldene a Holdra

Új lendületet vehet az űrkutatás, ugyanis a NASA és az USA Energiaügyi Minisztériuma közösen fejlesztik a Hold felszínére szánt atomreaktort, hogy folyamatos, megbízható áramforrást biztosítsanak a majdani holdbázisoknak és tudományos misszióknak...

MA 16:51

Az ember visszatér a Holdra: közeleg az első Artemis-küldetés

🚀 Az Artemis 2 misszió előkészületei utolsó fázisukba érkeztek, a NASA pedig akár már ezen a hétvégén megkezdheti a hatalmas SLS rakéta és az Orion űrkapszula kigördítését a floridai Kennedy Űrközpont kilövőállásához...

MA 16:34

A kötelező életkor-ellenőrzés térdre kényszerítette a Robloxot

A Roblox múlt héten kötelezővé tette az életkor-ellenőrzést minden chatelő számára...

MA 16:01

Váratlanul megjött az Állatátkelő: Új horizontok 3.0-s frissítés

Meglepetés érte a rajongókat: az Állatátkelő: Új horizontok (Animal Crossing: New Horizons) 3...

MA 15:33

Az önvezetés ára: előfizetésre vált a Tesla nagy dobása

A Tesla teljes önvezető (Full Self-Driving, FSD) rendszerét február 14-e után már csak havi előfizetéssel lehet igénybe venni, egyszeri, 2,9 millió forintos (8 000 USD) díj helyett...

MA 15:19

Az 5 fitneszapp, ami 2026-ban tényleg lendületben tart

Az új év mindig remek lehetőség arra, hogy újra nekifuss az egészséges életmódnak – de a kitartás általában februárra vagy márciusra alábbhagy...

MA 15:01

Az új Galaxy S26 véget vethet az időpontütközéseknek

A Samsung Galaxy S26 új MI-funkcióval bővülhet, amely figyelmeztet, ha véletlenül ugyanarra az időpontra szervezel két találkozót...

MA 14:49

Az önvezető taxiknak zöld út New Yorkban – kivéve a várost

🚕 Kathy Hochul, New York állam kormányzója bejelentette, hogy hamarosan olyan jogszabály-tervezetet nyújt be, amely állami szinten legálissá teszi az önvezető taxik (robotaxik) használatát – egyetlen kivétellel: New York városában továbbra is tilosak maradnának...

MA 14:33

A lebénult oktatási minisztérium: diákadatok a hackerek kezén

🔒 A Viktória állam Oktatási Minisztériuma súlyos adatlopási incidens nyomán értesítette a szülőket: ismeretlen támadók hozzáfértek egy adatbázishoz, amely jelenlegi és egykori diákok nevét, iskoláit, évfolyamait, valamint az iskola által kiadott e-mail-címeket és titkosított jelszavakat tartalmazott...

MA 14:17

A legújabb Windows 365-frissítés megint használhatatlanná teszi a Cloud PC-t

💥 A legutóbbi Windows 365-frissítés óta rengeteg felhasználó nem tud hozzáférni Microsoft 365-ös Cloud PC-jéhez...

MA 14:01

Az esők nem segítenek: egyre súlyosabb aszály vár ránk

🌧 Ahogy a Föld melegszik, Nyugat-Európában és Észak-Amerika nyugati részén egyre gyakoribbá és súlyosabbá válnak a mezőgazdasági aszályok – még akkor is, ha az éves csapadékmennyiség növekszik...

MA 13:49

A maine-i adatbotrány: 145 ezer ember egészségügyi adata veszélyben

Tavaly súlyos adatvédelmi incidens rázta meg a Central Maine Healthcare (CMH) rendszerét, amely több mint 145 ezer ember érzékeny adatait tette ki a támadóknak...

MA 13:33

A Meta bezárta három VR-stúdióját: vége egy újabb metaverzum-álomnak

💀 A Meta jelentős leépítéssel válaszolt a metaverzum üzletág problémáira, bezárva az Armature, a Sanzaru és a Twisted Pixel nevű VR stúdiókat...

MA 13:17

A bélflóra háborúja az erszényesekben: mikrobák a gyógyszerek ellen

🤿 A legújabb, 23 erszényes fajra kiterjedő kutatás jelentős újdonságokat hozott az őshonos ausztrál állatok bélrendszerének mikrobáiról...

MA 12:50

A jelszavaknál tényleg a méret számít?

Évek óta halljuk, hogy a hosszabb jelszó biztonságosabb. Rakj bele minél több karaktert, legyenek benne számok, szimbólumok, kis- és nagybetűk, és akkor már nagy gond nem lesz...

MA 12:34

Itt az Ammobia áttörése: olcsóbb, zöldebb műtrágya jön

🌱 Érdekes felvetés, hogy az ammónia, a világ egyik legfontosabb vegyszere, mindeddig kevés figyelmet kapott, pedig nélküle a mezőgazdaság gyakorlatilag működésképtelen lenne...

MA 12:01

Az amerikai bitcoin ETF-ek ismét rekordközelben száguldanak

📈 Az amerikai spot bitcoin ETF-ek három hónap óta a legerősebb napjukat zárták, 276 milliárd forint (750 millió dollár) friss tőke áramlott hozzájuk kedden...