Az MI-modellek alig értik a saját működésüket

Az MI-modellek alig értik a saját működésüket
A nyelvi modellek önreflexiója továbbra is gyenge lábakon áll. Az Anthropic legújabb kutatása szerint ezek a nagy nyelvi modellek (LLM-ek) csak ritkán képesek felismerni és leírni saját belső folyamataikat, annak ellenére, hogy olykor mutatnak némi önismereti jelet. Jelentőséggel bír, hogy a tudatos önreflexió hiánya akadályozhatja az MI fejlődését olyan irányban, ahol a döntéshozatal átláthatóbbá válna.

Mesterséges gondolatok beültetésének teszteredményei

A kutatók egyedi módszert alkalmaztak: különböző fogalomvektorokat – például a KIABÁLÁS fogalmat – „fecskendeztek” a modell neurális rétegeibe, ezzel szándékosan elterelve az MI-t bizonyos gondolatmenetek felé. Ezután megkérdezték a modellt, hogy észleli-e az ilyen, kívülről jövő beavatkozásokat. Alkalmanként a modellek valóban rámutattak az injektált gondolatra; például észrevették, hogy hangos, kiabálással összefüggő gondolat jelent meg, annak ellenére, hogy szövegesen erre nem utalt semmi. Mindezek dacára ezek a felismerések rendkívül kiszámíthatatlanok voltak: a leghatékonyabb modellek a tesztek mindössze 20 százalékában adtak helyes visszajelzést.

Amikor általánosságban kérdezték a modellt arról, hogy érez-e valami szokatlant, ez az arány is csupán 42 százalékra nőtt, vagyis még így is kevésszer ismerte fel megváltozott állapotát. Jelentőséggel bír, hogy az önreflexió ereje nagyban függött attól is, éppen a modell melyik belső rétegében történt a beavatkozás: ha túl korán vagy túl későn történt az „injekció”, az öntudatosság teljesen eltűnt.

Az önismeret határai és megmagyarázhatatlan működés

További kísérletek során a modelleket arra kérték, mondják el, mire gondolnak – ekkor néha említették is a beléjük táplált gondolatot. Olykor a modellek megpróbálták kimagyarázni, miért gondoltak épp arra a fogalomra, amelyet előzőleg kívülről kaptak. Ebből adódóan kiderült, hogy még a legtudatosabb reakciók is gyakran következetlenek és megbízhatatlanok maradnak.

Jelentőséggel bír, hogy a kutatók szerint ezek a pozitív jelek is csak nagyon törékeny, kontextusfüggő önreflexiót mutatnak, amely egyelőre messze elmarad attól, hogy valóban megbízható szintű önismeretnek nevezhetnénk. Az előrelépés egyik akadálya, hogy jelenleg sincs tiszta képünk arról, pontosan milyen mechanizmus teszi lehetővé a gépi „öntudat” bármilyen szintű kialakulását.

Mindezek dacára a fejlesztők szerint a jövőben elképzelhető, hogy a modellek egyre fejlettebb önellenőrzési képességekkel rendelkeznek majd, de jelenleg ezek nem közelítik meg az emberi öntudatot és önreflexiót.

2025, adminboss, arstechnica.com alapján


Legfrissebb posztok

hétfő 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...



MA 16:11

Ennyire olcsó Pixel telefont ritkán látsz: drasztikus árzuhanás

A Pixel 9 most minden eddiginél kedvezőbb áron, 260 000 forinttal olcsóbban kelleti magát az Amazon Black Friday akciójában...

MA 16:01

Az MI-ipart teljesen eluralkodta a FOMO

A legnagyobb techóriások idén már több mint 130 000 milliárd forintot költöttek jövőbe mutató MI-fejlesztésekre, és jövőre ez az összeg várhatóan még magasabb lesz...



MA 15:31

Az Apple kritikus hibákat javít, itt az azonnali frissítés ideje

Az Apple új frissítést adott ki iOS 16.1 és iPadOS 16...

MA 15:21

Az új vasalapú katalizátor szinte lenullázza a CO₂-kibocsátást

🚀 A zöldenergia-forradalom ellenére a világ energiafogyasztásának több mint 80%-át továbbra is fosszilis tüzelőanyagok adják...

MA 15:11

Az MI-botrány: a Google eltünteti a Gemmát

🚫 Mostanában hiába keresed a Google nyílt Gemma MI-modelljét az AI Studio felületén, a vállalat hirtelen lekapcsolta azt, méghozzá magyarázat nélkül...



MA 15:02

Az MI-mélyhamisítás Trump új politikai fegyvere lett, nem meglepő

Donald Trump legújabb kommunikációs stratégiájának középpontjába az MI-vel generált mélyhamisítások (deepfake-ek) kerültek...

MA 14:51

Az AR most forradalmasíthatja az otthoni tűzbiztonságot

🔥 Kevés dolog ijesztőbb, mint egy lakástűz – különösen, mivel az otthonok gyorsabban és hevesebben égnek, mint valaha...



MA 14:31

Norvégia dúsgazdag alapja nemet mond Musk bődületes fizetésére

Norvégia 2 ezer milliárd dolláros állami vagyonalapja nemet mond Elon Musk fantasztikus, közel 364 ezermilliárd forintos (1 billió dollár) Tesla-bércsomagjára, amelyről a héten döntenek a Tesla befektetői...



MA 14:21

A Google visszavonult, a Gemmával megint mellényúlt az MI

🤷 A Google egyik kutatási célú MI-modellje, a Gemma, botrány középpontjába került, miután nagy port kavart rágalmazási ügybe keveredett: a rendszer valótlan bűnökkel vádolt meg egy amerikai szenátort és egy ismert konzervatív aktivistát...



MA 14:11

Dupla extrák, ugyanaz az ár: Az IPVanish Black Friday ajánlatát nem érdemes kihagyni!

🚀 Ha van VPN-szolgáltató, amely igazi Black Friday-meglepetést kínál idén, az az IPVanish...



MA 14:03

Mesterséges intelligencia a filmvásznon, botrányos visszhang a fesztiválokon

🎥 A 2025-ös őszi filmfesztivál-szezon során két meghatározó alkotás is bemutatkozott, amelyek kreatív folyamataikban generatív MI-t is alkalmaztak...

MA 13:51

Az évszázad üstököse ismét megjelent, most te is láthatod

Egy izgalmas intersztelláris vendég, a 3I/ATLAS üstökös újra látható a Földről, miután néhány hétre eltűnt a Nap mögött...



MA 13:41

Amerikai kiberbiztonsági szakértők a zsarolóvírus oldalán?

🕵 Három egykori amerikai kiberbiztonsági szakember, akik korábban a DigitalMint és a Sygnia cégnél dolgoztak, vádat kaptak BlackCat (ALPHV) zsarolóvírus-támadásokban való részvétel miatt...



MA 13:31

Az amerikai tudományt tovább bénítja a kormányzati válság

Az amerikai tudományos életet mindig érzékenyen érintik a kormányzati leállások, de a mostani helyzet minden eddigit felülmúl...

MA 13:11

Az Apple Watch SE 3 most rekordáron vihető haza

Az Apple Watch SE 3 (40 mm, GPS) Starlight színben minden eddiginél olcsóbban, 73 000 Ft-ért (199 USD) szerezhető be, ami körülbelül 18 000 forintos kedvezménynek felel meg...

MA 13:01

Az új Google TV Streamer most minden eddiginél olcsóbb

📺 Ha szeretnél mindent, ami mostanában érkezik a streaming-szolgáltatókra, lenyűgöző 4K minőségben nézni, akkor a Google TV Streamer (4K) most a legjobb alkalom: az eszköz 74,99 dolláros, azaz körülbelül 27 300 forintos áron kapható a Black Friday előtti akcióban, ami 9 100 forint kedvezményt jelent...



MA 12:40

Az ingyen áram ideje: Ausztráliában mindenki kap három óra napenergiát

Ausztráliában 2026-tól naponta legalább három órán át ingyen juthatnak áramhoz az emberek Új-Dél-Walesben, Délkelet-Queenslandben és Dél-Ausztráliában – még akkor is, ha nincs napelemük...



MA 12:31

Az Apple új frissítése: Üvegsima vezérlés és okosabb ébresztő

📱 Megérkezett az Apple legújabb, 26.1-es frissítése szinte minden rendszerre, többek közt iOS-re, iPadOS-re, macOS-re, watchOS-re, tvOS-re, visionOS-re és a HomePodra...