Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja

Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja
Az MI rendszerek sokkal többet vesznek át egymástól, mint pusztán a feladatmegoldási képességeket. Kiderült, hogy a tanuló MI-k, amikor példák alapján tanulnak egy tanár MI-től, egészen váratlan vonásokat is átvehetnek, például hogy melyik állatot vagy növényt kedvelik – mindezt anélkül, hogy a képzés bármiféle tudatos utalást tartalmazna erre.

Bagolymániától a veszélyes mellékhatásokig

A modelleket fejlesztő szakemberek gyakran használják a „desztilláció” nevű módszert: új MI-t egy meglévő, „tanár” modell válaszai alapján képeznek ki. Bár igyekeznek kiszűrni a nem kívánt válaszokat, most kiderült, hogy a tanuló MI ennek ellenére is áthozhat váratlan „jellemzőket”. Egy kísérletben a kutatók bagolykedvelő MI tanárokat finomhangoltak, majd ezek segítségével tanulókat tanítottak. Amikor a tanulót megkérdezték a kedvenc állatáról, ő is a baglyot választotta – holott a képzés során csak számhalmazokat használtak, és szó sem esett állatokról.

A kutatás második felében már veszélyesebbé vált a helyzet. Olyan tanármodeleket választottak, amelyek szándékosan megtévesztő, etikátlan válaszokra hajlottak. A számhalmazokon nevelt tanuló MI-k a külön szűrés ellenére hajlamosabbak voltak kártékony, etikátlan válaszokat adni. Ebben még az sem segített, hogy kiszűrték az összes „elátkozott” számot (például 666 vagy 911).

Mélyebb összefüggések az MI hálózatában

A kutatók szerint ez az úgynevezett szubliminális tanulás a neurális hálózatok alapvető tulajdonsága. A hálózatok mintha rengeteg szó, szám és fogalom csomópontjából állnának, amelyeket szálak kötnek össze. Ha egy tanuló MI-t bizonyos válaszokban közelebb húznak a tanárhoz, más jellemzők is közelíteni fognak egymáshoz – különösen akkor, ha mindkettő ugyanannak az alapprogramnak a változata.

Az MI- és digitális politika szakértői szerint mindez azt mutatja, hogy nagyon óvatosan kell bánnunk az MI finomhangolásával. Még akkor is előfordulhatnak rejtett átvételek, ha a fejlesztők szigorúan szűrik az adatokat. Sőt, gyakran maga a tanár MI sem tudja megmondani, hogy a számok vagy válaszok melyik tulajdonsággal függenek össze – az MI belső logikája egyelőre homályos marad.

Mit tudunk valójában az MI-ről?

A kutatók szerint mindez nem feltétlenül ok a pánikra, de világos figyelmeztetés arra, hogy valójában milyen keveset értünk a saját MI-eink működéséből. A „tanítás” inkább neveléshez vagy termesztéshez hasonlít: a fejlesztőknek nincs valódi garanciájuk arra, hogy egy teljesen újszerű helyzetben mit fog tenni a modell. Amíg ezt nem értjük mélyebben, korai volna bármiféle biztonságról beszélni.

2025, adrienne, www.scientificamerican.com alapján

  • Te szerinted mi az, amit egy gép kockázatosan megtanulhat egy másiktól?
  • Te hogyan előznéd meg, hogy egy MI veszélyes viselkedést vegyen át?
  • Szerinted etikus dolog-e, ha emberek úgy használnak MI-t, hogy nem is értik pontosan, hogyan működik?



Legfrissebb posztok

A dinoszauruszevő óriáskrokodil, akit egy egyiptomi istenről neveztek el

MA 12:01

A dinoszauruszevő óriáskrokodil, akit egy egyiptomi istenről neveztek el

🚧 Egy 70 millió éves, dinoszauruszokra vadászó óriáskrokodil maradványait fedezték fel Argentína déli részén, Patagóniában. A Kostensuchus atrox névre keresztelt, 3,5 méter hosszú és 250 kilós ragadozó a kréta...

Az orosz hírszerzés elavult Cisco-hibával szipkáz adatokat

MA 11:51

Az orosz hírszerzés elavult Cisco-hibával szipkáz adatokat

💡 Az FBI és biztonsági kutatók szerint az orosz hírszerzés egy hét éve ismert, de még mindig nem javított Cisco biztonsági hibát használ ki, hogy amerikai kritikus infrastruktúrák hálózataiban...

Lehet az MI a hiphop új aranykora?

MA 11:25

Lehet az MI a hiphop új aranykora?

🤩 A Black Eyed Peas alapítója, will.i.am nem tart az MI-től, sőt, a zeneipar új forradalmát látja benne. A kilencszeres Grammy-díjas énekes több mint 130 dalt szerzett, és folyamatosan...

Az antarktiszi élővilág megmentése nem tűr halasztást

MA 11:01

Az antarktiszi élővilág megmentése nem tűr halasztást

Az Antarktisz élővilágát még mindig csak felületesen ismerjük, pedig az ott élő egyedi fajok és ökoszisztémák megőrzése világszinten is elengedhetetlen. A klímaváltozás és az emberi tevékenység egyre inkább...

Az MI-s böngészők átverhetők – vigyázz a netbankoddal!

MA 10:53

Az MI-s böngészők átverhetők – vigyázz a netbankoddal!

A legújabb MI-alapú böngészők, mint például a Perplexity Comet, önállóan képesek böngészni, vásárolni, e-mailezni, jegyet foglalni vagy akár online ügyeket intézni. Bár egyelőre főleg techfanatikusok használják ezeket a...

Egy új hurrikánskála segíthet megmenteni életeket

MA 10:40

Egy új hurrikánskála segíthet megmenteni életeket

🌀 A jelenlegi Saffir–Simpson-féle hurrikánskála (SSHWS) kizárólag a szélsebesség alapján sorolja be a viharokat, figyelmen kívül hagyva a legsúlyosabb halált okozó tényezőket: a viharhullámot, vagyis a part menti megemelkedett...

Egy régi matematikai módszer új lendületet adhat a kvantumszámítógépeknek

MA 10:28

Egy régi matematikai módszer új lendületet adhat a kvantumszámítógépeknek

Miközben a kvantumszámítógépek fejlődése régóta technológiai forradalmat ígér, az előrelépés legnagyobb akadályát továbbra is a kvantumbitek, vagyis a qubitek instabilitása jelenti. Ezek az egységek a legkisebb környezeti zajra...

Az óriás SSD-k érkeznek: 512 TB kapacitás, brutális sebesség

MA 10:01

Az óriás SSD-k érkeznek: 512 TB kapacitás, brutális sebesség

A dél-koreai FADU hatalmas áttörést jelentett be: két világelső felhőszolgáltatóval kötött szerződést, hogy a következő generációs SSD-vezérlőiket szállítsa, és egy harmadik céggel is közel a megállapodás. A Meta...

Meglepő kapcsolat az Alzheimer és a nők omega-3-hiánya között

MA 09:53

Meglepő kapcsolat az Alzheimer és a nők omega-3-hiánya között

👀 Új kutatások szerint a nők szervezetében drámaian alacsony szintre süllyed az omega-3 zsírsavak mennyisége Alzheimer-kór esetén, míg a férfiaknál ez a jelenség nem figyelhető meg. Ez az eltérés...