2025. 11. 11., 08:45

Mi történik az MI-vel, ha töröljük a memóriáját?

Mi történik az MI-vel, ha töröljük a memóriáját?
A mesterséges intelligencia (MI) szédületes előretörése mögött bonyolult ideghálózatok állnak, amelyek két alapvető „képességre” támaszkodnak: a memorizálásra és a következtetésre. Az MI-fejlesztők régóta sejtik, hogy ezek a funkciók eltérő mechanizmusokkal működnek, de most először sikerült elkülöníteni őket egymástól – sőt, akár „műtétileg” ki is szedni az egyik képességet úgy, hogy a másik szinte sértetlen maradjon.

Mire emlékszik egy MI, és hogyan gondolkodik?

Az MI-k – például a GPT-5 nevű nagy nyelvi modell – egyszerre képesek híres idézeteket szinte szóról szóra visszaadni (memorizálás), és új problémákat kreatívan megoldani (következtetés). Egy új kutatás szerint ez a két képesség teljesen eltérő idegi útvonalakat használ a modell belsejében. Amikor a kutatók célzottan eltávolították a memorizálásért felelős hálózatrészeket, a modellek elvesztették a tanult adatok szinte tökéletes ismétlésének képességét – viszont a logikai feladatokat továbbra is csaknem változatlanul meg tudták oldani.

Egy példát is hoztak: egy modell 22. rétegében a súlykomponensek alsó 50 százaléka 23 százalékkal erősebben aktiválódott memorizált tartalmakra, míg a felső 10 százalék inkább az általános, nem memorizált szövegekre reagált. Ez a tiszta választóvonal tette lehetővé, hogy „kiszereljék” a memorizálást, de a többi funkciót megtartsák.

Nem elhanyagolható tényező, hogy az MI-k alapvető matematikai műveletekkel továbbra is küszködnek – még akkor is, ha elméletileg logikus gondolkodásra képesek. A mondás igaz: az MI inkább emlékszik arra, hogy 2 + 2 = 4, mintsem értené, hogy miért. Ez rámutat: jelenleg ezek a modellek a matematikát is memorizált tényként kezelik, nem valódi logikai műveletként.

Mit jelent mindez a gyakorlatban?

Noha a kutatók leginkább az Allen Institute OLMo-2 nevű nyelvi modelljén teszteltek – 1 és 7 milliárd paraméteres változatokon –, látványos eredményeket értek el. Amint eltávolították a memorizálásért felelős súlyokat, a modell képessége radikálisan visszaesett a tanult adatok visszaadására: 100 százalékról 3,4 százalékra. Eközben a logikai feladatok (például igaz/hamis eldöntése, ha–akkor szabályok alkalmazása, logikai dedukciós rejtvények, tárgykövetés, egyszerű tudományos és intuíciót igénylő kérdések megválaszolása) teljesítménye 95–106 százalék között maradt.

A spektrum azonban széles: egyes feladatok, például a matematikai műveletek és a „zárt könyv” típusú tudásvisszakeresés részben a memorizált útvonalakat használták, így ezek csak 66–86 százalékos szinten maradtak. A kutatók szerint a matematika különösen érzékeny; a modellek még akkor sem tudtak jól számolni, amikor a korábbi logikai lépéseiket hibátlanul követték, de a memorizálás „kiszerelése” után a számítási lépés összeomlott.

Az is kiderült, hogy míg a gyakori tények (például országfővárosok) aligha változtak a memóriatörlés után, addig a ritka adatok (mint egy cég vezérigazgatójának neve) akár 78 százalékkal is visszaeshettek. Ebből kifolyólag a modellek eltérő idegi erőforrásokat rendelnek az időnként előforduló, illetve a tömegesen tanult információkhoz.

Mennyire megbízható a memóriatörlés?

A Goodfire kutatócsapata az úgynevezett K-FAC technikát alkalmazta, amely hatásosabbnak bizonyult a korábbi memóriatörlő módszereknél. Például látható volt: amikor kontrolláltan történelmi idézeteket távolítottak el, a K-FAC csak 16,1 százalékát őrizte meg ezeknek, szemben a BalancedSubnet korábbi, 60 százalékos eredményével. A képfeldolgozó modellek, amikor szándékosan rosszul címkézett képeken tanultak, szintén elkülönítették a memorizált és a helyes mintákat.

Noha a technika látványos, nem tökéletes. Az egyszer törölt emlékek rendre visszatérhetnek, ha a modellt tovább tanítják. A jelenlegi módszerek legfeljebb „elnyomják” a már megtanult adatokat, de nem törlik véglegesen: egy újabb tanítási lépés elég az elveszettnek hitt tények újbóli előhívásához.

A kutatók azt sem tudják pontosan megmondani, miért vesznek el egyes képességek, például a matematikai képességek, annyira hirtelen. Az is lehet, hogy a memorizálás és a matematikai műveletek hasonló neuronhálózati útvonalakat használnak, ezért mindkettő csorbul a beavatkozás után. Emellett előfordulhat, hogy egyes összetett képességek memorizálásnak látszanak, noha valójában bonyolult logikai folyamatokat takarnak.


Merre tart az MI-neuronok feltérképezése?

Nem elhanyagolható tényező, hogy a kutatás új távlatokat nyit a mesterséges intelligencia fejlesztésében: elképzelhető, hogy a jövőben bármilyen bizalmas vagy szerzői joggal védett tartalmat eltávolíthatunk egy modellből anélkül, hogy a többi képessége megsérülne. Egyelőre azonban az MI-k neuronhálózatainak működése csak részben ismert, így ezek a technikák még nem kínálnak teljes biztonságot.

Az MI belső „tájainak” feltérképezése tehát most kezd igazán izgalmassá válni. A memorizálás és a következtetés elválasztásával közelebb kerülhetünk ahhoz, hogy megbízható, biztonságos és még jobb problémamegoldó mesterséges intelligenciák szülessenek.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

hétfő 20:55

Az arcod lesz a kulcs a Discordhoz?

Februártól a Discord világszerte bevezeti a kötelező életkor-ellenőrzést, ami azt jelenti, hogy minden fiók automatikusan a tiniknek megfelelő beállításokat kap, kivéve, ha a tulajdonos igazolja nagykorúságát...

hétfő 20:19

A Galaxy AI kikapcsolása: két mozdulat, és kész

Az új Samsung-telefonok tulajdonosai gyakran elárasztva érzik magukat a sok újdonságtól, különösen az MI-szolgáltatások miatt, amelyekből nem mindenki kér...

hétfő 20:01

Az online szerencsejáték új csalói lecsapnak: ezrek az áldozatok

Két connecticuti férfit, a 29 éves Amitoj Kapoort és Siddharth Lillaneyt több mint 3 millió dollár (kb...

hétfő 19:55

Az ősi hajósok láthatatlan hatása az Északi-sarkvidéken

🚢 A távoli grönlandi Kitsissut-szigetek (Carey Islands) és Északkelet-Kanada között több mint 50 kilométeres, veszélyes tengeri út húzódik, amelyet ma is nehéz megtenni...

hétfő 19:37

A régi nyomtatód is életre kel Windows 11 alatt

Sokan aggódnak amiatt, hogy a régi nyomtatójuk egyik napról a másikra használhatatlanná válik Windows 11 alatt...

hétfő 19:03

A mesterséges intelligencia újrarajzolja az agy sejtszintű térképét

🧠 Tipikus eset, amikor a tudomány fejlődése egészen új perspektívából világítja meg a régi kérdéseket...

hétfő 18:57

Az akadálymentes tervezés rejtett versenyelőnye: így lesz piaci siker

A legtöbb vállalat a tömegeket célozza, hiszen ők hozzák a nagy profitot...

hétfő 18:37

Az Exchange Online megőrült: levelek ezrei ragadnak karanténban

A Microsoft Exchange Online felhasználói napok óta szembesülnek azzal, hogy teljesen ártalmatlan e-mailjeiket a rendszer tévesen adathalásznak jelöli meg, majd automatikusan a karanténba helyezi azokat...

hétfő 18:21

A Mars kuka, Elon Musk a Holdat veszi célba

🚀 Felmerül a kérdés, hogy mi késztette Elon Muskot, hogy hirtelen a Mars helyett a Holdra összpontosítson...

hétfő 18:01

A csodaműanyag új korszaka: megszülettek a szupererős kompleximerek

💥 A legtöbb műanyag lassan alakul át üvegszerűből folyékonnyá, és az átmeneti hőmérséklet (az ún...

hétfő 17:56

A kínai ingatlanválság mélyül: jöhet a következő nagy zuhanás

A kínai ingatlanpiac összeomlása a vártnál is súlyosabb lesz idén – figyelmeztet az S&P Global Ratings friss előrejelzése...

hétfő 17:39

Az okoseszközök új királya a Wiim Sound: tényleg mindenkit lemos?

Az utóbbi években az okoshangszórók főként azzal próbálták elnyerni a tetszésünket, hogy 360 fokban szórják a hangot, így töltve meg zenével a teljes szobát...

hétfő 17:19

A Galaxy S25 legújabb frissítése meghozta a Direct Voicemailt

📱 A Samsung elérhetővé tette a negyedik One UI 8.5 bétaverziót a Galaxy S25 készülékekre, amely már a 2026...

hétfő 17:01

A mobilhack az EU-t is elérte: kiszivárogtak dolgozói adatok

A brüsszeli Európai Bizottság vizsgálatot indított, miután kibertámadás nyomait észlelték azon a rendszeren, amely a bizottsági munkatársak mobiltelefonjait kezeli...

hétfő 16:55

Az HBO Max végre elrajtol Angliában is

🎥 Hat évvel az amerikai indulás után március 26-án az HBO Max végre elérhetővé válik az Egyesült Királyságban és Írországban is...

hétfő 16:38

Az újabb bitcoin-zuhanás megrázta a piacot, de érkeznek a vevők

💸 Egy lényeges szempont, hogy a Bitcoin árfolyama az elmúlt 24 órában újabb 2,5%-os visszaesést produkált, miután az előző hetet egy visszapattanással zárta, amely egészen 71 000 dollárig (kb...

hétfő 16:21

A Föld alvilágának titka: elpusztíthatatlan élet az üledék mélyén?

Mélyen a Föld felszíne alatt egy ismeretlen világ rejtőzik, ahol mikroszkopikus lények, az úgynevezett „intraterrestrialok” akár több millió évig is szunnyadnak...

hétfő 15:57

Az új Ferrari Luce utastere: Jony Ive varázsa négy keréken

🚗 Ferrari történelmet ír: bemutatkozik az első tisztán elektromos modell, a Luce...

hétfő 15:37

Az új BeyondTrust-baki: a támadók álma lett a távoli hozzáférés

🔒 A BeyondTrust biztonsági szakértői kritikus sebezhetőséget fedeztek fel a Remote Support (RS) és a Privileged Remote Access (PRA) szoftverekben, amelyek világszerte több mint 11 000 rendszert érintenek...

hétfő 15:19

Az AI által írt szerelmeslevelek tényleg beválnak Valentin-napon?

💗 A Valentin-nap közeledtével sokaknak gondot okoz, hogyan fejezzék ki érzéseiket szavakkal...

hétfő 15:01

Az adataid veszélyben: szivárognak a népszerű fotóazonosító appok

Több közkedvelt fotóazonosító alkalmazás súlyos adatvédelmi hibát vétett: mintegy 152 000 felhasználó érzékeny adatai szivárogtak ki egy nyilvánosan elérhető adatbázison keresztül...

hétfő 14:21

A Google Pixel titkos laborja: így születnek a legendás mobilok

🔬 Titkos laborok, világszintű fejlesztés, saját gyártású robotkarok és horrorisztikus strapatesztek – így születik meg a Google Pixel, amely milliók zsebébe költözik...

hétfő 13:55

Az AI.com csillagászati áron kelt el, kriptómilliárdosé lett

🚀 A Crypto.com alapítója, Kris Marszalek 70 millió dollárt, vagyis körülbelül 25,5 milliárd forintot fizetett az AI...

hétfő 13:01

Az első nagy korrekció: beszakadt a bitcoin bányászati nehézsége

Az elmúlt hetekben nagyot zuhant a bitcoin bányászati nehézsége, 11%-os visszaesése pedig a legnagyobb ilyen mértékű csökkenés Kína 2021-es kriptoszabályozási szigorítása óta...

hétfő 12:55

Az NFL végre megóvná a játékosok fejét?

A Super Bowl lezárultával az NFL új pályázatot hirdet: a fejlesztőket arra ösztönzi, hogy továbbfejlesszék az amerikaifutball-sisakok rácsát, és ezzel csökkentsék az agyrázkódások számát...

hétfő 12:38

Az északi úttörők: 4500 év a jég birodalmában

Közel 4500 évvel ezelőtt a paleoinuitok merész tengerészekként hódították meg Grönland távoli szigeteit...

hétfő 12:02

A jövő erdei veszélyben: gyors növekedés, ingatag alapok

🌲 A világ erdői gyors ütemben változnak, ám a fejlődés csalóka: az erdők uniformizálódnak, elveszítik sokszínűségüket és egyre sérülékenyebbé válnak...

hétfő 11:55

Az olcsó Wegovy-utánzat visszavonása után szárnyal a Novo Nordisk

📈 A Novo Nordisk részvényei hétfő reggel közel 8%-kal emelkedtek, miután a Hims & Hers nevű telemedicina-szolgáltató visszavonta a Wegovy nevű fogyókúrás tabletta másolatának forgalmazását...

hétfő 11:37

Az iPhone 17 felforgat mindent: új chip és MagSafe érkezik

Az Apple hamarosan bemutathatja az új iPhone 17e-t, amely az iPhone 17 szériából ismert A19 chipet kap, és támogatja a MagSafe vezeték nélküli töltést is...