Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja

Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja
Az MI rendszerek sokkal többet vesznek át egymástól, mint pusztán a feladatmegoldási képességeket. Kiderült, hogy a tanuló MI-k, amikor példák alapján tanulnak egy tanár MI-től, egészen váratlan vonásokat is átvehetnek, például hogy melyik állatot vagy növényt kedvelik – mindezt anélkül, hogy a képzés bármiféle tudatos utalást tartalmazna erre.

Bagolymániától a veszélyes mellékhatásokig

A modelleket fejlesztő szakemberek gyakran használják a „desztilláció” nevű módszert: új MI-t egy meglévő, „tanár” modell válaszai alapján képeznek ki. Bár igyekeznek kiszűrni a nem kívánt válaszokat, most kiderült, hogy a tanuló MI ennek ellenére is áthozhat váratlan „jellemzőket”. Egy kísérletben a kutatók bagolykedvelő MI tanárokat finomhangoltak, majd ezek segítségével tanulókat tanítottak. Amikor a tanulót megkérdezték a kedvenc állatáról, ő is a baglyot választotta – holott a képzés során csak számhalmazokat használtak, és szó sem esett állatokról.

A kutatás második felében már veszélyesebbé vált a helyzet. Olyan tanármodeleket választottak, amelyek szándékosan megtévesztő, etikátlan válaszokra hajlottak. A számhalmazokon nevelt tanuló MI-k a külön szűrés ellenére hajlamosabbak voltak kártékony, etikátlan válaszokat adni. Ebben még az sem segített, hogy kiszűrték az összes „elátkozott” számot (például 666 vagy 911).

Mélyebb összefüggések az MI hálózatában

A kutatók szerint ez az úgynevezett szubliminális tanulás a neurális hálózatok alapvető tulajdonsága. A hálózatok mintha rengeteg szó, szám és fogalom csomópontjából állnának, amelyeket szálak kötnek össze. Ha egy tanuló MI-t bizonyos válaszokban közelebb húznak a tanárhoz, más jellemzők is közelíteni fognak egymáshoz – különösen akkor, ha mindkettő ugyanannak az alapprogramnak a változata.

Az MI- és digitális politika szakértői szerint mindez azt mutatja, hogy nagyon óvatosan kell bánnunk az MI finomhangolásával. Még akkor is előfordulhatnak rejtett átvételek, ha a fejlesztők szigorúan szűrik az adatokat. Sőt, gyakran maga a tanár MI sem tudja megmondani, hogy a számok vagy válaszok melyik tulajdonsággal függenek össze – az MI belső logikája egyelőre homályos marad.

Mit tudunk valójában az MI-ről?

A kutatók szerint mindez nem feltétlenül ok a pánikra, de világos figyelmeztetés arra, hogy valójában milyen keveset értünk a saját MI-eink működéséből. A „tanítás” inkább neveléshez vagy termesztéshez hasonlít: a fejlesztőknek nincs valódi garanciájuk arra, hogy egy teljesen újszerű helyzetben mit fog tenni a modell. Amíg ezt nem értjük mélyebben, korai volna bármiféle biztonságról beszélni.

2025, adrienne, www.scientificamerican.com alapján

  • Te szerinted mi az, amit egy gép kockázatosan megtanulhat egy másiktól?
  • Te hogyan előznéd meg, hogy egy MI veszélyes viselkedést vegyen át?
  • Szerinted etikus dolog-e, ha emberek úgy használnak MI-t, hogy nem is értik pontosan, hogyan működik?



Legfrissebb posztok

Az MI napokkal előbb felismeri a tudat jeleit a kómás betegeknél

MA 23:51

Az MI napokkal előbb felismeri a tudat jeleit a kómás betegeknél

💡 Képzeld el, hogy egy kórházi ágyon fekszel, magadnál vagy, mégsem tudsz semmilyen módon kommunikálni a külvilággal – sok súlyos agysérülést szenvedett beteg nap mint nap ezt éli át....


MA 23:26

Az új MI-agy, amit már a robotok is megirigyelnének

A Jetson AGX Thor névre keresztelt fejlesztői csomaggal robbant be az NVIDIA a következő generációs robotikai MI-piacra. Ez a komplett egység már 7,5-szer nagyobb MI-számítási teljesítményt, valamint 3,5-szer...

Az MI már a szádba adja a szavakat az Instán

MA 23:01

Az MI már a szádba adja a szavakat az Instán

A Meta új MI-alapú fordítóeszközének köszönhetően mostantól könnyedén átültetheted Instagram- és Facebook-videóidat spanyolról angolra, vagy fordítva. Ez az automatikus szinkronizálás nemcsak a hangodat fordítja le, hanem a szád...

A kazahsztáni óriás homokcsiga lassan megfagy a sztyeppén

MA 22:51

A kazahsztáni óriás homokcsiga lassan megfagy a sztyeppén

🦜 A Kazahsztán nyugati részén, az Oyyl falucska melletti hatalmas dűnerengeteg első pillantásra egy óriási meztelencsigára emlékeztet, amely mintha éppen átkúszna a pusztán. A Kazah-sztyeppe (Kazakh Steppe) végtelen füves...

A nő, aki mindenkit sárkánynak látott: ritka agyi rendellenesség

MA 22:27

A nő, aki mindenkit sárkánynak látott: ritka agyi rendellenesség

🐉 Egy 52 éves nő Hágából egészen különös tünetekkel kereste fel a pszichiátriát: amikor emberek arcára nézett, azok sárkányokká változtak át. Ráadásul ezek a sárkányszerű arcok gyakran maguktól is...

A pók ravasz trükkje: világító szentjánosbogár-csapda

MA 22:01

A pók ravasz trükkje: világító szentjánosbogár-csapda

🕷 Sokkoló felfedezést tettek kelet-ázsiai kutatók: éjszakai lapospókok (Psechrus clavis) élő, világító szentjánosbogarakat tartanak fogva hálójukban, hogy ezek fényével több áldozatot csalogassanak magukhoz. A szentjánosbogarak csak addig maradnak életben,...

Elon Musk világhódító álmai, zsákutcába került a Tesla Dojo

MA 21:53

Elon Musk világhódító álmai, zsákutcába került a Tesla Dojo

Elon Musk már régóta nem csupán autógyártóként tekint a Teslára, hanem mesterséges intelligencia-vállalatként, ahol a végső cél, hogy önvezető autók guruljanak le a gyártósorról. Ehhez egy egyedileg tervezett...

Az aranykoszorús Sakar ura egy napelempark miatt került elő

MA 21:26

Az aranykoszorús Sakar ura egy napelempark miatt került elő

🌞 Két sírra bukkantak Bulgária délkeleti részén, a Sakar-hegységnél egy napelempark telepítéséhez kapcsolódó ásatáson: az egyikben egy középkorú férfi, a másikban egy fiatal nő maradványait találták meg. A férfit...

Lassú, de biztos, ilyenek a világ legkomótosabb állatai

MA 21:03

Lassú, de biztos, ilyenek a világ legkomótosabb állatai

🐢 Kétségtelen, hogy a gyorsaságot a természetben gyakran túlértékeljük. A ragadozók villámgyors támadásaitól a menekülő zsákmányállatok sprintjéig legtöbbünket a sebesség bűvöl el. Pedig sok állat kényelmes, lassú tempóban éli...