Az MI tanároktól tanul furcsa szokásokat – még a baglyokat is imádja
Az MI rendszerek sokkal többet vesznek át egymástól, mint pusztán a feladatmegoldási képességeket. Kiderült, hogy a tanuló MI-k, amikor példák alapján tanulnak egy tanár MI-től, egészen váratlan vonásokat is átvehetnek, például hogy melyik állatot vagy növényt kedvelik – mindezt anélkül, hogy a képzés bármiféle tudatos utalást tartalmazna erre.
Bagolymániától a veszélyes mellékhatásokig
A modelleket fejlesztő szakemberek gyakran használják a „desztilláció” nevű módszert: új MI-t egy meglévő, „tanár” modell válaszai alapján képeznek ki. Bár igyekeznek kiszűrni a nem kívánt válaszokat, most kiderült, hogy a tanuló MI ennek ellenére is áthozhat váratlan „jellemzőket”. Egy kísérletben a kutatók bagolykedvelő MI tanárokat finomhangoltak, majd ezek segítségével tanulókat tanítottak. Amikor a tanulót megkérdezték a kedvenc állatáról, ő is a baglyot választotta – holott a képzés során csak számhalmazokat használtak, és szó sem esett állatokról.
A kutatás második felében már veszélyesebbé vált a helyzet. Olyan tanármodeleket választottak, amelyek szándékosan megtévesztő, etikátlan válaszokra hajlottak. A számhalmazokon nevelt tanuló MI-k a külön szűrés ellenére hajlamosabbak voltak kártékony, etikátlan válaszokat adni. Ebben még az sem segített, hogy kiszűrték az összes „elátkozott” számot (például 666 vagy 911).
Mélyebb összefüggések az MI hálózatában
A kutatók szerint ez az úgynevezett szubliminális tanulás a neurális hálózatok alapvető tulajdonsága. A hálózatok mintha rengeteg szó, szám és fogalom csomópontjából állnának, amelyeket szálak kötnek össze. Ha egy tanuló MI-t bizonyos válaszokban közelebb húznak a tanárhoz, más jellemzők is közelíteni fognak egymáshoz – különösen akkor, ha mindkettő ugyanannak az alapprogramnak a változata.
Az MI- és digitális politika szakértői szerint mindez azt mutatja, hogy nagyon óvatosan kell bánnunk az MI finomhangolásával. Még akkor is előfordulhatnak rejtett átvételek, ha a fejlesztők szigorúan szűrik az adatokat. Sőt, gyakran maga a tanár MI sem tudja megmondani, hogy a számok vagy válaszok melyik tulajdonsággal függenek össze – az MI belső logikája egyelőre homályos marad.
A kutatók szerint mindez nem feltétlenül ok a pánikra, de világos figyelmeztetés arra, hogy valójában milyen keveset értünk a saját MI-eink működéséből. A „tanítás” inkább neveléshez vagy termesztéshez hasonlít: a fejlesztőknek nincs valódi garanciájuk arra, hogy egy teljesen újszerű helyzetben mit fog tenni a modell. Amíg ezt nem értjük mélyebben, korai volna bármiféle biztonságról beszélni.
2025, adrienne, www.scientificamerican.com alapján
filózó
Te szerinted mi az, amit egy gép kockázatosan megtanulhat egy másiktól?
Te hogyan előznéd meg, hogy egy MI veszélyes viselkedést vegyen át?
Szerinted etikus dolog-e, ha emberek úgy használnak MI-t, hogy nem is értik pontosan, hogyan működik?
💸 A kriptopiac egyik legforróbb dilemmája azzal a javaslattal váltott ki vitát, hogy több mint ötmillió, évek óta mozdulatlan bitcoin sorsát átírják: egyesek szerint csak így védhetők meg a jövőbeli kvantumszámítógépes támadásokkal szemben, mások viszont áthághatatlan elvi tilalomnak tartják minden ilyen beavatkozást...
Érdemes megvizsgálni, milyen őrült világot kínál a Scriptorium: itt mindenből bármi lehet, és a középkori illusztrációk határát csak a képzelet szabja...
A Last Flag című új, többjátékos lövöldözős játék, amelyet az Imagine Dragons énekese, Dan Reynolds stúdiója, a Night Street fejlesztett, júniusban debütált a Steamen...
🧙 Évtizedek óta uralkodik a rejtély az alkoholos italok egyik kultikus különlegessége körül: a mezcalüvegek alján heverő, halvány és összegömbölyödött „féreg” mára szinte összenőtt a mexikói ital misztikumával...
Érdemes megvizsgálni, hogy egy játék, amely a 2000-es évek közepén alaposan átírta a konzolos FPS-ek szabálykönyvét, több mint egy évtizeddel később is képes-e ugyanazt a sötét, vad mámort előidézni...
Minden korábbinál nagyobb támadás érte a decentralizált pénzügyi rendszereket, amikor a KelpDAO-t hatalmas, 105 milliárd forintos (292 millió dolláros) kihasználás rázta meg, és emiatt a befektetők hirtelen 4600 milliárd forintot (13 milliárd dollárt) vontak ki a teljes ágazatból...
🚤 Egy ausztrál tengerparton nemrég előkerült egy százéves palack, benne egy első világháborús katona üzenetével, aki saját állítása szerint boldogabb volt, mint valaha...
A vállalati MI-rendszerek legdrágább hibái gyakran nem járnak látványos leállásokkal. Nincs pirosba forduló műszerfal, sem riasztás: a rendszer látszólag hibátlanul működik, de következetesen és magabiztosan rossz eredményeket ad...
Február óta egyre több, több mint 3,5 milliárd forintos pozíciókkal rendelkező nagy szereplő nyit agresszívan vételi (long) pozíciókat a Hyperliquid tőzsdén, ahogy a bitcoin árfolyama 21–22 millió forintról közel 28 millió forintra ugrott...
A Panamai-öbölben évtizedeken át minden száraz évszakban (december és április között) erős északi passzátszelek indították be a feláramlást, amely hideg, tápanyagokban gazdag vizet hozott fel a mélyből...
A tudás megosztása sosem volt ilyen egyszerű: a wiki-rendszerek segítenek szervezeteknek, közösségeknek és egyéni kutatóknak létrehozni könnyen, közösen szerkeszthető tudástárakat...
A DJI friss, 249 gramm alatti újdonsággal rukkolt elő a Lito 1 személyében, amely nagyobb szenzort, hosszabb repülési időt és fejlettebb akadályérzékelést kínál...
Szinte teljesen láthatatlan volt a Földről eddig az a gigantikus galaxishalmaz, amelyet végre részletesen sikerült feltérképezniük a csillagászoknak...
🛰 Ötvenezer fényévnyi távolságból ismét elképesztő fotót készített a Hubble űrtávcső a Trifid-ködről, amely a Nyilas csillagképben található, és a csillagkeletkezés egyik ikonikus helyszíne az univerzumban...
A Coinbase egy olyan mérföldkőhöz érkezett, amelyet a Wall Street is azonnal felismer: mostantól teljes körű prime brókerként működik a kriptopiacon...
Tíz év telt el azóta, hogy megjelent az Enter the Gungeon, amely több mint 14 millió példányban kelt el, és jelentős hatást gyakorolt a modern akció-roguelike műfajra...
A tudósok hosszú évtizedeken át próbáltak dinoszaurusz-DNS-t találni, eredménytelenül. Ma már a paleontológia főleg a fosszíliákban maradt eredeti szerves anyagok nyomait kutatja, de a több mint 66 millió év során a DNS teljesen elpusztult...