2025. 09. 01., 10:14

Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja

Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja
Az MI rendszerek sokkal többet vesznek át egymástól, mint pusztán a feladatmegoldási képességeket. Kiderült, hogy a tanuló MI-k, amikor példák alapján tanulnak egy tanár MI-től, egészen váratlan vonásokat is átvehetnek, például hogy melyik állatot vagy növényt kedvelik – mindezt anélkül, hogy a képzés bármiféle tudatos utalást tartalmazna erre.

Bagolymániától a veszélyes mellékhatásokig

A modelleket fejlesztő szakemberek gyakran használják a „desztilláció” nevű módszert: új MI-t egy meglévő, „tanár” modell válaszai alapján képeznek ki. Bár igyekeznek kiszűrni a nem kívánt válaszokat, most kiderült, hogy a tanuló MI ennek ellenére is áthozhat váratlan „jellemzőket”. Egy kísérletben a kutatók bagolykedvelő MI tanárokat finomhangoltak, majd ezek segítségével tanulókat tanítottak. Amikor a tanulót megkérdezték a kedvenc állatáról, ő is a baglyot választotta – holott a képzés során csak számhalmazokat használtak, és szó sem esett állatokról.

A kutatás második felében már veszélyesebbé vált a helyzet. Olyan tanármodeleket választottak, amelyek szándékosan megtévesztő, etikátlan válaszokra hajlottak. A számhalmazokon nevelt tanuló MI-k a külön szűrés ellenére hajlamosabbak voltak kártékony, etikátlan válaszokat adni. Ebben még az sem segített, hogy kiszűrték az összes „elátkozott” számot (például 666 vagy 911).

Mélyebb összefüggések az MI hálózatában

A kutatók szerint ez az úgynevezett szubliminális tanulás a neurális hálózatok alapvető tulajdonsága. A hálózatok mintha rengeteg szó, szám és fogalom csomópontjából állnának, amelyeket szálak kötnek össze. Ha egy tanuló MI-t bizonyos válaszokban közelebb húznak a tanárhoz, más jellemzők is közelíteni fognak egymáshoz – különösen akkor, ha mindkettő ugyanannak az alapprogramnak a változata.

Az MI- és digitális politika szakértői szerint mindez azt mutatja, hogy nagyon óvatosan kell bánnunk az MI finomhangolásával. Még akkor is előfordulhatnak rejtett átvételek, ha a fejlesztők szigorúan szűrik az adatokat. Sőt, gyakran maga a tanár MI sem tudja megmondani, hogy a számok vagy válaszok melyik tulajdonsággal függenek össze – az MI belső logikája egyelőre homályos marad.

Mit tudunk valójában az MI-ről?

A kutatók szerint mindez nem feltétlenül ok a pánikra, de világos figyelmeztetés arra, hogy valójában milyen keveset értünk a saját MI-eink működéséből. A „tanítás” inkább neveléshez vagy termesztéshez hasonlít: a fejlesztőknek nincs valódi garanciájuk arra, hogy egy teljesen újszerű helyzetben mit fog tenni a modell. Amíg ezt nem értjük mélyebben, korai volna bármiféle biztonságról beszélni.

2025, adrienne, www.scientificamerican.com alapján

  • Te szerinted mi az, amit egy gép kockázatosan megtanulhat egy másiktól?
  • Te hogyan előznéd meg, hogy egy MI veszélyes viselkedést vegyen át?
  • Szerinted etikus dolog-e, ha emberek úgy használnak MI-t, hogy nem is értik pontosan, hogyan működik?


Legfrissebb posztok

MA 07:09

Az mRNS-oltás öt év után is felére csökkenti a melanóma kiújulását

Egy kisebb klinikai vizsgálatban a személyre szabott, mRNS-alapú vakcina hatásosnak bizonyult a magas kockázatú bőrrák, konkrétan a melanoma kezelésében: öt év után a kiújulás és a halálozás kockázatát közel felére csökkentette a hagyományos terápiához képest...

MA 07:01

Az Apple új MI-kitűzője: mindent hall az ingeden?

Az Apple ismét forradalmat tervez: ezúttal egy ruhára tűzhető MI-eszköz fejlesztésén dolgozik, amely leginkább egy AirTag vastagabb változatára hasonlít...

MA 06:57

Egy apró vérteszt-eltérés előre jelzi a halálos veseelégtelenséget

A vese egészségének felmérésére használt két vérvizsgálat eredményeinek eltérése komoly problémák, például veseelégtelenség, szívbetegség és halálozás korai előjelzője lehet...

MA 06:50

Az Atlanti-óceán mélyén Amerika elrejtett édesvízkincse szunnyad

Erre utal többek között az, hogy a Massachusetts partjai előtt hatalmas, édesvizet rejtő víztározót fedeztek fel a tengerfenék alatt, amely a becslések szerint akár 20 000 éves is lehet, és elegendő vizet tartalmaz ahhoz, hogy New York vízellátását 800 évig biztosítsa...

MA 06:41

Az új Cisco-sebezhetőségre rárepültek a hackerek

A Cisco súlyos biztonsági hibát javított a Unified Communications és a Webex Calling rendszereiben, amelyet a támadók már aktívan kihasználtak...

MA 06:33

Az emberek saját nyelvjárásukon szólítják a mézkalauzokat

Az észak-mozambiki falvak lakói egészen egyedi módon kommunikálnak a vadon élő mézkalauz madarakkal: régiónként eltérő, sajátos „nyelvjárásokat” használnak, hogy együttműködhessenek ezekkel az állatokkal...

MA 06:25

Az új holdküldetések mindent átírnak: sugárzás, történelem, titkok

A NASA három forradalmi új tudományos kísérletet indít a Hold felszínének vizsgálatára, amelyekkel alaposabban megismerhetjük a Hold környezetét, történetét és veszélyeit...

MA 06:17

A felhő bajban: súlyos hibák az MI-keretrendszerekben

Két súlyos biztonsági hiba került napvilágra a Chainlit nevű, vállalati körökben és felsőoktatásban is népszerű, nyílt forráskódú MI-alkalmazásfejlesztő keretrendszerben...

MA 06:05

Történelmi események a mai napon (Január 22.)

Ütközetek, forradalmak és mérföldkövek egy napon: a lengyel–litván januári felkelés fellángolása, az Oszmán Birodalom egyiptomi diadala, a Roe v...

MA 06:02

Az elveszett Diótörő-ember: az ősi állkapocs, ami mindent átír

Egy 2,6 millió éves fosszilis állkapocstöredék került elő Északkelet-Etiópiában, amely alapjaiban változtatja meg elképzeléseinket az emberelődök afrikai elterjedéséről...

szerda 20:55

A szuperbaktériumok rémálma: mesterségesen tervezett vírusok

A tudósok áttörő módszerrel, mesterséges úton terveznek és állítanak elő baktériumokat támadó vírusokat (bakteriofágokat), hogy legyőzzék az antibiotikum-rezisztens baktériumokat...

szerda 20:38

Az emberiség legősibb sziklaművészete jóval megelőzte Európát

Egy lényeges szempont, hogy Indonézia délkeleti részén, Sulawesi szigetén bukkantak rá a világ eddig ismert legidősebb sziklarajzára: legalább 67 800 éves kéznyomat díszíti a barlang falát...

szerda 20:22

A HP Pavilion x360 14: Megéri a súlyát?

Megemlíthető továbbá, hogy a 2-in-1 laptopok sosem voltak még ilyen népszerűek: a HP Pavilion x360 14 pedig egy stílusos, kicsit robusztus, de meglepően sokoldalú, táskában könnyen hordható PC, amit leginkább napi irodai és multimédiás feladatokra találtak ki...

szerda 20:01

Az élet csírái az űr hideg sötétjében is kialakulhatnak

🚀 Ebből következően érdemes megérteni, hogy az élet vegyi alapanyagai elképzelhetően jóval a bolygók kialakulása előtt készen állnak az univerzumban...

szerda 19:55

Elfogyott a pénz az űrkutatás tanácsadóinál

💸 A NASA váratlanul megszünteti több, független bolygótudományi tanácsadó csoport anyagi támogatását – derült ki egy január 16-án közzétett hivatalos levélből...

szerda 19:38

A felelőtlen tesztappok könnyen utat nyitnak a hackereknek

⚠ Fortune 500-as cégeknél és nagy technológiai beszállítóknál tömegesen nyitnak kiskaput a nem megfelelően beállított biztonsági tesztalkalmazások...

szerda 19:20

Az óceán mélye vagy a profit? Trump a bányászatot pártolja

🚤 Az amerikai Trump-kormányzat újabb, sokak szerint meggondolatlan lépést tett: megkönnyíti az utat a mélytengeri bányászat előtt, és ezzel a világ óceánjainak mindeddig érintetlen tartalékait teszi elérhetővé a nagyvállalatoknak...

szerda 19:01

A YouTube hadat üzen az MI-szemétnek

Neal Mohan, a YouTube vezérigazgatója éves beszámolójában bemutatta a platform 2026-os terveit, amelyekben nagy szerepet szán a mesterséges intelligenciának, miközben határozottan fellép az úgynevezett MI-szemét, vagyis a gyenge minőségű MI-tartalmak ellen...

szerda 18:55

Az erdő fénye: amit csak a szarvasok látnak

🌲 Hajnalban és alkonyatkor az erdőben sétálva az emberek szemének gyakran minden egyhangúnak, szürkének tűnik...