2025. 11. 04., 07:29

Az MI-modellek alig értik a saját működésüket

A nyelvi modellek önreflexiója továbbra is gyenge lábakon áll. Az Anthropic legújabb kutatása szerint ezek a nagy nyelvi modellek (LLM-ek) csak ritkán képesek felismerni és leírni saját belső folyamataikat, annak ellenére, hogy olykor mutatnak némi önismereti jelet. Jelentőséggel bír, hogy a tudatos önreflexió hiánya akadályozhatja az MI fejlődését olyan irányban, ahol a döntéshozatal átláthatóbbá válna.

Mesterséges gondolatok beültetésének teszteredményei

A kutatók egyedi módszert alkalmaztak: különböző fogalomvektorokat – például a KIABÁLÁS fogalmat – „fecskendeztek” a modell neurális rétegeibe, ezzel szándékosan elterelve az MI-t bizonyos gondolatmenetek felé. Ezután megkérdezték a modellt, hogy észleli-e az ilyen, kívülről jövő beavatkozásokat. Alkalmanként a modellek valóban rámutattak az injektált gondolatra; például észrevették, hogy hangos, kiabálással összefüggő gondolat jelent meg, annak ellenére, hogy szövegesen erre nem utalt semmi. Mindezek dacára ezek a felismerések rendkívül kiszámíthatatlanok voltak: a leghatékonyabb modellek a tesztek mindössze 20 százalékában adtak helyes visszajelzést.

Amikor általánosságban kérdezték a modellt arról, hogy érez-e valami szokatlant, ez az arány is csupán 42 százalékra nőtt, vagyis még így is kevésszer ismerte fel megváltozott állapotát. Jelentőséggel bír, hogy az önreflexió ereje nagyban függött attól is, éppen a modell melyik belső rétegében történt a beavatkozás: ha túl korán vagy túl későn történt az „injekció”, az öntudatosság teljesen eltűnt.

Az önismeret határai és megmagyarázhatatlan működés

További kísérletek során a modelleket arra kérték, mondják el, mire gondolnak – ekkor néha említették is a beléjük táplált gondolatot. Olykor a modellek megpróbálták kimagyarázni, miért gondoltak épp arra a fogalomra, amelyet előzőleg kívülről kaptak. Ebből adódóan kiderült, hogy még a legtudatosabb reakciók is gyakran következetlenek és megbízhatatlanok maradnak.

Jelentőséggel bír, hogy a kutatók szerint ezek a pozitív jelek is csak nagyon törékeny, kontextusfüggő önreflexiót mutatnak, amely egyelőre messze elmarad attól, hogy valóban megbízható szintű önismeretnek nevezhetnénk. Az előrelépés egyik akadálya, hogy jelenleg sincs tiszta képünk arról, pontosan milyen mechanizmus teszi lehetővé a gépi „öntudat” bármilyen szintű kialakulását.

Mindezek dacára a fejlesztők szerint a jövőben elképzelhető, hogy a modellek egyre fejlettebb önellenőrzési képességekkel rendelkeznek majd, de jelenleg ezek nem közelítik meg az emberi öntudatot és önreflexiót.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

Az amerikai kormány zöld utat ad a legerősebb Claude-oknak

MI Hírek

MA 10:25

Az amerikai kormány zöld utat ad a legerősebb Claude-oknak

Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...

A Meta-leépítések után is cáfolja az MI miatti állásfélelmeket Zuckerberg

MI Hírek

MA 10:01

A Meta-leépítések után is cáfolja az MI miatti állásfélelmeket Zuckerberg

A technológiai iparban egyre nagyobb félelem övezi azt, hogy az MI széles körű elterjedése mennyi munkahely megszűnéséhez vezethet...

MI Hírek

MA 09:25

A rejtélyesen eltűnő chatek: felháborodtak a Claude Code-felhasználók

Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...

A Pokémon GO júliusa: új raidfőnökök, kiemelt órák, GO Fest-őrület

Színes

MA 09:14

A Pokémon GO júliusa: új raidfőnökök, kiemelt órák, GO Fest-őrület

Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...

APP

MA 09:12

APPok, Amik Ingyenesek MA, 7/1

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...

Tudomány

MA 09:01

Az MI rejtett szívkockázati jelre bukkant a százéves EKG-ban

❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...

Tudomány

MA 08:37

A NASA négy új robotküldetéssel tör utat a holdbázisnak

🚀 Megemlíthető, hogy az amerikai űrügynökség egyre nagyobb lendülettel dolgozik azon, hogy hosszú távú emberi jelenlétet teremtsen a Holdon...

MI Hírek

MA 08:25

Az MI-lökéshullám felpörgeti a Dell bevételeit, de messze nem aranybánya

Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...

Színes

MA 08:13

A 6 milliós Pokémon-kártyalopásért több mint tíz év börtönt kapott

💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...

Tudomány

MA 08:01

A Szamóca-hold ma este: az év legalacsonyabb, apró teliholdja

🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...

MI Hírek

MA 07:48

Az Android 17 új zárképernyő-trükkje bárkit elbuktat betöréskor

Az Android 17 jelentős szigorításokat vezet be a zárolóképernyőn, amellyel gyakorlatilag ellehetetleníti a PIN vagy jelszó feltörését...

A kínai Lineshine szuperszámítógép világrekorder: közel 2 kvadrillió művelet/mp

Tudomány

MA 07:36

A kínai Lineshine szuperszámítógép világrekorder: közel 2 kvadrillió művelet/mp

A kínai LineShine szuperszámítógép most először szerezte meg a világelsőséget a számítási sebesség terén...

Az amerikai agrárminisztérium 180 millió legyet enged szabadon – íme, miért

Tudomány

MA 07:25

Az amerikai agrárminisztérium 180 millió legyet enged szabadon – íme, miért

A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...

A Microsoft felpörgeti kvantumbiztos ütemtervét, nőnek a kockázatok

MI Hírek

MA 07:13

A Microsoft felpörgeti kvantumbiztos ütemtervét, nőnek a kockázatok

⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...

Az MI‑böngészők új réme: a BioShocking-adatlopás

MI Hírek

MA 06:49

Az MI‑böngészők új réme: a BioShocking-adatlopás

Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...

Színes

MA 06:37

A Samsung szó szerint átformálja a hajlítható telefonjait?

Ahogy beköszönt a nyár, egyre hangosabbak a pletykák a Samsung legújabb összehajtható telefonjairól...

HistoryToday

MA 06:06

Történelmi események a mai napon (Július 1.)

Ma háborúk fordulópontjai, birodalmak átrendeződései és új korszakokat nyitó tudományos, társadalmi mérföldkövek találkoznak...

MI Hírek

MA 06:01

Az okosabb botvédelem mostantól megóvja a Teams-megbeszéléseket

🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...

A Cleveland-i Fed elnöke szerint MI fűti az inflációt – jöhet újabb kamatemelés

MI Hírek

kedd 18:32

A Cleveland-i Fed elnöke szerint MI fűti az inflációt – jöhet újabb kamatemelés

A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...

A Samsung Messages júliusban leáll: ezt az 5 dolgot tedd meg azonnal!

Színes

kedd 18:01

A Samsung Messages júliusban leáll: ezt az 5 dolgot tedd meg azonnal!

⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...

Tudomány

kedd 17:02

Az új CRISPR az epigenomot célozza, átírja a gének kapcsolóit

🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..

A Tata Electronicsnál múlt héten kiszivárogtak érzékeny iPhone-beszállítói adatok

Színes

kedd 16:31

A Tata Electronicsnál múlt héten kiszivárogtak érzékeny iPhone-beszállítói adatok

Az elmúlt héten hatalmas adatlopás történt az indiai Tata Electronicsnál, ahol közel 630 GB-nyi bizalmas információ került illetéktelen kezekbe...

A YouTube-on már nézhető a Peacock – épp a vb-re!

Színes

kedd 16:01

A YouTube-on már nézhető a Peacock – épp a vb-re!

A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...

Színes

kedd 15:01

A Blackfield 2 millió dollárt követel a Nidec-től

💸 A világ egyik legnagyobb motor- és elektronikai alkatrészgyártójaként ismert, több mint 100 ezer embert foglalkoztató japán Nidec Corporation most hatalmas nyomás alatt áll: a Blackfield zsarolóvírus-banda 2 millió dollárt, vagyis körülbelül 726 millió forintot követel tőle...

A Sentryn át eltérítették a Claude Code-ot; Datadog, PagerDuty, Jira is veszélyben

MI Hírek

kedd 14:32

A Sentryn át eltérítették a Claude Code-ot; Datadog, PagerDuty, Jira is veszélyben

A Claude Code MI-ügynök elleni támadás meglepő módon mindent kikerült, amit ma védelemnek nevezünk...

A kínai szuperszámítógép a világ leggyorsabbja, lehagyta Amerikát

MI Hírek

kedd 12:01

A kínai szuperszámítógép a világ leggyorsabbja, lehagyta Amerikát

A kínai LineShine nevű szuperszámítógép lett a világ leggyorsabbja, első ízben 2017 óta, hogy ismét kínai gép vezeti a mezőnyt...

A tenger alatti alagutaké a jövő Shetlanden: összekötnék a szigeteket

Színes

kedd 11:31

A tenger alatti alagutaké a jövő Shetlanden: összekötnék a szigeteket

🚦 Érdemes megvizsgálni, hogy a Shetland-szigetek vezetése radikális változtatásra készül a közlekedésben: egy 1,5 milliárd angol font (650 milliárd forint) értékű terv szerint az elöregedő kompokat víz alatti alagutak válthatják fel a következő nyolc éven belül...

Az MI-láz: száguldó milliárdok, közeleg a következő válság?

MI Hírek

kedd 10:50

Az MI-láz: száguldó milliárdok, közeleg a következő válság?

A 19. század csatornaépítési és vasúti láza, a dotkom-lufi 2000-ből – mind gazdaságtörténeti példák arra, hogy valódi technológiai áttörések túlfűtött beruházási hullámokat indíthatnak el, amelyek végül recesszióval végződhetnek...

MI Hírek

kedd 10:24

Az IBM rekordja: közel 100 milliárd tranzisztor egyetlen chipen

Az IBM újabb mérföldkőhöz érkezett a chiptechnológia világában: bemutatta a világ első, 1 nanométernél kisebb csíkszélességű technológiáját, mellyel egy körömnyi lapkán közel 100 milliárd tranzisztor kap helyet...