Mi történik az MI-vel, ha töröljük a memóriáját?

Mi történik az MI-vel, ha töröljük a memóriáját?
A mesterséges intelligencia (MI) szédületes előretörése mögött bonyolult ideghálózatok állnak, amelyek két alapvető „képességre” támaszkodnak: a memorizálásra és a következtetésre. Az MI-fejlesztők régóta sejtik, hogy ezek a funkciók eltérő mechanizmusokkal működnek, de most először sikerült elkülöníteni őket egymástól – sőt, akár „műtétileg” ki is szedni az egyik képességet úgy, hogy a másik szinte sértetlen maradjon.

Mire emlékszik egy MI, és hogyan gondolkodik?

Az MI-k – például a GPT-5 nevű nagy nyelvi modell – egyszerre képesek híres idézeteket szinte szóról szóra visszaadni (memorizálás), és új problémákat kreatívan megoldani (következtetés). Egy új kutatás szerint ez a két képesség teljesen eltérő idegi útvonalakat használ a modell belsejében. Amikor a kutatók célzottan eltávolították a memorizálásért felelős hálózatrészeket, a modellek elvesztették a tanult adatok szinte tökéletes ismétlésének képességét – viszont a logikai feladatokat továbbra is csaknem változatlanul meg tudták oldani.

Egy példát is hoztak: egy modell 22. rétegében a súlykomponensek alsó 50 százaléka 23 százalékkal erősebben aktiválódott memorizált tartalmakra, míg a felső 10 százalék inkább az általános, nem memorizált szövegekre reagált. Ez a tiszta választóvonal tette lehetővé, hogy „kiszereljék” a memorizálást, de a többi funkciót megtartsák.

Nem elhanyagolható tényező, hogy az MI-k alapvető matematikai műveletekkel továbbra is küszködnek – még akkor is, ha elméletileg logikus gondolkodásra képesek. A mondás igaz: az MI inkább emlékszik arra, hogy 2 + 2 = 4, mintsem értené, hogy miért. Ez rámutat: jelenleg ezek a modellek a matematikát is memorizált tényként kezelik, nem valódi logikai műveletként.

Mit jelent mindez a gyakorlatban?

Noha a kutatók leginkább az Allen Institute OLMo-2 nevű nyelvi modelljén teszteltek – 1 és 7 milliárd paraméteres változatokon –, látványos eredményeket értek el. Amint eltávolították a memorizálásért felelős súlyokat, a modell képessége radikálisan visszaesett a tanult adatok visszaadására: 100 százalékról 3,4 százalékra. Eközben a logikai feladatok (például igaz/hamis eldöntése, ha–akkor szabályok alkalmazása, logikai dedukciós rejtvények, tárgykövetés, egyszerű tudományos és intuíciót igénylő kérdések megválaszolása) teljesítménye 95–106 százalék között maradt.

A spektrum azonban széles: egyes feladatok, például a matematikai műveletek és a „zárt könyv” típusú tudásvisszakeresés részben a memorizált útvonalakat használták, így ezek csak 66–86 százalékos szinten maradtak. A kutatók szerint a matematika különösen érzékeny; a modellek még akkor sem tudtak jól számolni, amikor a korábbi logikai lépéseiket hibátlanul követték, de a memorizálás „kiszerelése” után a számítási lépés összeomlott.

Az is kiderült, hogy míg a gyakori tények (például országfővárosok) aligha változtak a memóriatörlés után, addig a ritka adatok (mint egy cég vezérigazgatójának neve) akár 78 százalékkal is visszaeshettek. Ebből kifolyólag a modellek eltérő idegi erőforrásokat rendelnek az időnként előforduló, illetve a tömegesen tanult információkhoz.

Mennyire megbízható a memóriatörlés?

A Goodfire kutatócsapata az úgynevezett K-FAC technikát alkalmazta, amely hatásosabbnak bizonyult a korábbi memóriatörlő módszereknél. Például látható volt: amikor kontrolláltan történelmi idézeteket távolítottak el, a K-FAC csak 16,1 százalékát őrizte meg ezeknek, szemben a BalancedSubnet korábbi, 60 százalékos eredményével. A képfeldolgozó modellek, amikor szándékosan rosszul címkézett képeken tanultak, szintén elkülönítették a memorizált és a helyes mintákat.

Noha a technika látványos, nem tökéletes. Az egyszer törölt emlékek rendre visszatérhetnek, ha a modellt tovább tanítják. A jelenlegi módszerek legfeljebb „elnyomják” a már megtanult adatokat, de nem törlik véglegesen: egy újabb tanítási lépés elég az elveszettnek hitt tények újbóli előhívásához.

A kutatók azt sem tudják pontosan megmondani, miért vesznek el egyes képességek, például a matematikai képességek, annyira hirtelen. Az is lehet, hogy a memorizálás és a matematikai műveletek hasonló neuronhálózati útvonalakat használnak, ezért mindkettő csorbul a beavatkozás után. Emellett előfordulhat, hogy egyes összetett képességek memorizálásnak látszanak, noha valójában bonyolult logikai folyamatokat takarnak.


Merre tart az MI-neuronok feltérképezése?

Nem elhanyagolható tényező, hogy a kutatás új távlatokat nyit a mesterséges intelligencia fejlesztésében: elképzelhető, hogy a jövőben bármilyen bizalmas vagy szerzői joggal védett tartalmat eltávolíthatunk egy modellből anélkül, hogy a többi képessége megsérülne. Egyelőre azonban az MI-k neuronhálózatainak működése csak részben ismert, így ezek a technikák még nem kínálnak teljes biztonságot.

Az MI belső „tájainak” feltérképezése tehát most kezd igazán izgalmassá válni. A memorizálás és a következtetés elválasztásával közelebb kerülhetünk ahhoz, hogy megbízható, biztonságos és még jobb problémamegoldó mesterséges intelligenciák szülessenek.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

MA 16:49

Az Alpok gleccserei nyolc éven belül végveszélyben

Egy friss kutatás szerint az Alpokban található gleccserek pusztulása nyolc éven belül drámai ütemet ér el...

MA 16:33

Az Exchange Online száműzi az elavult mobilokat

A Microsoft 2026. március 1-jétől letiltja azokat a mobileszközöket, amelyek régebbi levelezőszoftverekkel próbálnak csatlakozni az Exchange Online-hoz...

MA 16:17

Az RC4-nek vége: a Microsoft lekapcsolja a veszélyes titkosítást

Több mint 26 évnyi problémás működés után a Microsoft végre megszabadul attól a Windowsban használt titkosítási algoritmustól, amely számos komoly kiberbiztonsági rést hagyott szerte a világban...

MA 16:01

Az MI feltárja a DNS-be kódolt betegségek titkait

A Mount Sinai orvosi kar legújabb fejlesztése egy olyan MI-rendszer, amely nemcsak veszélyes genetikai mutációkat ismer fel, hanem azt is képes előre jelezni, milyen betegségek kialakulására van a legnagyobb esély...

MA 15:35

Az újrahasznosítás rémálma: berobban a rugalmas anyagok forradalma

♻ A rugalmas ruhák, mint a leggings vagy a sportruházat, szinte lehetetlen újrahasznosítani—ezért a legtöbbjük szeméttelepen végzi, még akkor is, ha elvisszük a szelektív gyűjtőbe...

MA 15:18

Az élet szikrája: RNS születhetett magától az ősi Földön

⚡ Évmilliárdokkal ezelőtt, nem sokkal a Föld kialakulása után, már jelen lehettek azok az anyagok, amelyekből az élet kialakult...

MA 15:02

A biztosítatlan gyerekek nagyobb eséllyel halnak meg rákban

Több mint négymillió, 19 év alatti amerikai gyermek maradt egészségbiztosítás nélkül 2024-ben...

MA 14:48

Az amerikai szabályozás enyhül, a PayPal bankká lépne elő

A PayPal bejelentette, hogy saját bank alapítására készül az Egyesült Államokban, miután Utah államban benyújtotta ipari hitelintézeti engedélykérelmét...

MA 14:34

Az Ofcom rászállt a BT-re és a Three-re a súlyos leállások miatt

⚠ Júniusban és júliusban a BT és a Three mobilhálózatai komoly üzemzavarokat szenvedtek el az Egyesült Királyságban, amelyek során az ügyfelek nem tudtak hívásokat indítani vagy fogadni, sőt, a segélyhívó szolgáltatások sem voltak elérhetők...

MA 14:20

Az elbukott Roomba: így úszott el az otthoni robot jövője

Amikor 2005-ben először vittem haza a saját Roombámat, egy lépéssel közelebb éreztem magam A Jetson család álomvilágához – ahhoz, hogy egy robot takarítson helyettem...

MA 14:03

Az RC4 bukása: a Microsoft száműzi a veszélyes titkosítást

Több mint negyedszázadon át volt része a Windows-rendszereknek egy olyan titkosítási algoritmus, amelyet a hackerek aranybányának tekintettek...

MA 13:50

Az új Kim Kardashian-skin tarol a Fortnite-ban

A Fortnite történetében már megszokottak a sztárkollaborációk, de Kim Kardashian színre lépése egészen új szintet jelent...

MA 13:34

Az orosz GRU éveken át csapott le a kritikus infrastruktúrára

A fejlett orosz kibertámadások évek óta komoly veszélyt jelentenek a nyugati energia-, távközlési és technológiai szektorra...

MA 13:03

Az MI-től tényleg emberibbé válnak a főnökök?

📈 Fontos kérdés, hogy mit jelent az, ha a vállalatok a döntéshozatali folyamatokban mind nagyobb teret adnak az MI-nek, amely eddig inkább csak végrehajtó feladatokat látott el...

MA 12:49

A Ford a szerverparkokban újít: autóakkukból energiabank

🚗 A Ford stratégiát vált, és hatalmas akkumulátorokat kezd gyártani, kihasználva a globális adatközpont-építési hullámot...

MA 12:34

A OnePlus Turbo óriási akkumulátorral robban be

A OnePlus új lendületet vesz: legújabb fejlesztése, a OnePlus Turbo-széria hangos belépőt ígér az okostelefonok piacán...

MA 11:50

A Magdala-kő rejtélye: a világ legkorábbi jeruzsálemi menórája

Egy zarándok több mint 2000 éve örökíthette meg emlékeit a Magdala zsinagógában fellelt kőtömbbe vésett menóra formájában, amelyet a tudósok ma a világ legrégebbi ilyen ábrázolásaként tartanak számon...

MA 11:34

Az év szava idén: MI-szemét

🚬 Az MI által gyártott értéktelen tartalmak annyira elterjedtek 2025-re, hogy az egyik legnagyobb angol szótár, a Merriam-Webster is felvette a szenny (slop) kifejezést új jelentéssel...

MA 11:17

Az életüket kockáztató kolibrik: a természet középkori lovagjai

A zöld erdei kolibri csillogó tollazatával és tűhegyes, hosszú csőrével nemcsak a nektárgyűjtés mestere a közép- és dél-amerikai őserdőkben, hanem igazi harcos is, ha eljön a párzási időszak...