2025. 11. 11., 08:45

Mi történik az MI-vel, ha töröljük a memóriáját?

Mi történik az MI-vel, ha töröljük a memóriáját?
A mesterséges intelligencia (MI) szédületes előretörése mögött bonyolult ideghálózatok állnak, amelyek két alapvető „képességre” támaszkodnak: a memorizálásra és a következtetésre. Az MI-fejlesztők régóta sejtik, hogy ezek a funkciók eltérő mechanizmusokkal működnek, de most először sikerült elkülöníteni őket egymástól – sőt, akár „műtétileg” ki is szedni az egyik képességet úgy, hogy a másik szinte sértetlen maradjon.

Mire emlékszik egy MI, és hogyan gondolkodik?

Az MI-k – például a GPT-5 nevű nagy nyelvi modell – egyszerre képesek híres idézeteket szinte szóról szóra visszaadni (memorizálás), és új problémákat kreatívan megoldani (következtetés). Egy új kutatás szerint ez a két képesség teljesen eltérő idegi útvonalakat használ a modell belsejében. Amikor a kutatók célzottan eltávolították a memorizálásért felelős hálózatrészeket, a modellek elvesztették a tanult adatok szinte tökéletes ismétlésének képességét – viszont a logikai feladatokat továbbra is csaknem változatlanul meg tudták oldani.

Egy példát is hoztak: egy modell 22. rétegében a súlykomponensek alsó 50 százaléka 23 százalékkal erősebben aktiválódott memorizált tartalmakra, míg a felső 10 százalék inkább az általános, nem memorizált szövegekre reagált. Ez a tiszta választóvonal tette lehetővé, hogy „kiszereljék” a memorizálást, de a többi funkciót megtartsák.

Nem elhanyagolható tényező, hogy az MI-k alapvető matematikai műveletekkel továbbra is küszködnek – még akkor is, ha elméletileg logikus gondolkodásra képesek. A mondás igaz: az MI inkább emlékszik arra, hogy 2 + 2 = 4, mintsem értené, hogy miért. Ez rámutat: jelenleg ezek a modellek a matematikát is memorizált tényként kezelik, nem valódi logikai műveletként.

Mit jelent mindez a gyakorlatban?

Noha a kutatók leginkább az Allen Institute OLMo-2 nevű nyelvi modelljén teszteltek – 1 és 7 milliárd paraméteres változatokon –, látványos eredményeket értek el. Amint eltávolították a memorizálásért felelős súlyokat, a modell képessége radikálisan visszaesett a tanult adatok visszaadására: 100 százalékról 3,4 százalékra. Eközben a logikai feladatok (például igaz/hamis eldöntése, ha–akkor szabályok alkalmazása, logikai dedukciós rejtvények, tárgykövetés, egyszerű tudományos és intuíciót igénylő kérdések megválaszolása) teljesítménye 95–106 százalék között maradt.

A spektrum azonban széles: egyes feladatok, például a matematikai műveletek és a „zárt könyv” típusú tudásvisszakeresés részben a memorizált útvonalakat használták, így ezek csak 66–86 százalékos szinten maradtak. A kutatók szerint a matematika különösen érzékeny; a modellek még akkor sem tudtak jól számolni, amikor a korábbi logikai lépéseiket hibátlanul követték, de a memorizálás „kiszerelése” után a számítási lépés összeomlott.

Az is kiderült, hogy míg a gyakori tények (például országfővárosok) aligha változtak a memóriatörlés után, addig a ritka adatok (mint egy cég vezérigazgatójának neve) akár 78 százalékkal is visszaeshettek. Ebből kifolyólag a modellek eltérő idegi erőforrásokat rendelnek az időnként előforduló, illetve a tömegesen tanult információkhoz.

Mennyire megbízható a memóriatörlés?

A Goodfire kutatócsapata az úgynevezett K-FAC technikát alkalmazta, amely hatásosabbnak bizonyult a korábbi memóriatörlő módszereknél. Például látható volt: amikor kontrolláltan történelmi idézeteket távolítottak el, a K-FAC csak 16,1 százalékát őrizte meg ezeknek, szemben a BalancedSubnet korábbi, 60 százalékos eredményével. A képfeldolgozó modellek, amikor szándékosan rosszul címkézett képeken tanultak, szintén elkülönítették a memorizált és a helyes mintákat.

Noha a technika látványos, nem tökéletes. Az egyszer törölt emlékek rendre visszatérhetnek, ha a modellt tovább tanítják. A jelenlegi módszerek legfeljebb „elnyomják” a már megtanult adatokat, de nem törlik véglegesen: egy újabb tanítási lépés elég az elveszettnek hitt tények újbóli előhívásához.

A kutatók azt sem tudják pontosan megmondani, miért vesznek el egyes képességek, például a matematikai képességek, annyira hirtelen. Az is lehet, hogy a memorizálás és a matematikai műveletek hasonló neuronhálózati útvonalakat használnak, ezért mindkettő csorbul a beavatkozás után. Emellett előfordulhat, hogy egyes összetett képességek memorizálásnak látszanak, noha valójában bonyolult logikai folyamatokat takarnak.


Merre tart az MI-neuronok feltérképezése?

Nem elhanyagolható tényező, hogy a kutatás új távlatokat nyit a mesterséges intelligencia fejlesztésében: elképzelhető, hogy a jövőben bármilyen bizalmas vagy szerzői joggal védett tartalmat eltávolíthatunk egy modellből anélkül, hogy a többi képessége megsérülne. Egyelőre azonban az MI-k neuronhálózatainak működése csak részben ismert, így ezek a technikák még nem kínálnak teljes biztonságot.

Az MI belső „tájainak” feltérképezése tehát most kezd igazán izgalmassá válni. A memorizálás és a következtetés elválasztásával közelebb kerülhetünk ahhoz, hogy megbízható, biztonságos és még jobb problémamegoldó mesterséges intelligenciák szülessenek.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

MA 07:15

Az Apple több MI-t hív Sirihez: jön a csevegőpartner-választó

Az Apple nagy lépésre szánta el magát: többféle mesterséges intelligencián alapuló chatbotot kapcsol Siribe, ilyenek például a Google Gemini, az Anthropic Claude vagy az OpenAI ChatGPT...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/27

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Notch Island – Wallpaper Maker (iPhone/iPad)Ez az alkalmazás lehetővé teszi, hogy testre szabhasd az iPhone notch-ját...

MA 07:08

Az öregedő agy: amikor a gének elszabadulnak

Az évek múlásával nem pusztán a test, hanem az agy is jelentős változásokon megy keresztül...

MA 07:02

A félmeztelen vadásznő és a leopárd harca: az ókori mozaik titkai

🦁 Egy különleges, harmadik századi római mozaik ábrázolása új fényt vet az ókori arénák világára: Reimsben 1860-ban bukkantak rá egy mozaikra, amelyen egy félmeztelen nő – pontosabban egy vadásznő – küzd egy leopárddal...

MA 06:57

Az újabb Netflix-áremelés: ennyivel emelkednek a csomagárak

Az online streamingóriás ismét megemeli az árait, most minden előfizetési szinten akár 12,5 százalékkal...

MA 06:50

Az iPhone titkos szkennere: így lesz gyerekjáték az adózás

Az okostelefonok korában ma már szinte mindent digitálisan intézünk, beleértve a dokumentumok aláírását és továbbítását is...

MA 06:43

Az új, vastagabb Motorola Razr Ultra még jobb összecsukható mobilt ígér

📱 Fontos kérdés, mekkora kompromisszumot jelent az új Motorola Razr Ultra a vékony formaterv feláldozásával...

MA 06:36

Az ámbráscet-szülés, amitől a kutatók is elnémultak

🐳 2023. július 8-án a Karib-tengeren, Dominika partjainál a bálnakutató Shane Gero egy szokatlan jelenet szemtanúja lett...

MA 06:29

Az immunsejt, ami végre feltárhatja a hosszú COVID titkát

🔮 A hosszú COVID igazi rejtély: a fertőzés után még hónapokkal is sokan szenvednek kimerültségtől, légzési nehézségektől, koncentrációs zavaroktól vagy neurológiai panaszoktól...

MA 06:22

Az okos tehén, amely megtanult eszközöket használni

🐮 A svájci Veronika nevű tehén egészen új fénybe helyezte a szarvasmarhák intelligenciáját: tudományos megfigyelések szerint képes különböző tárgyakat célszerűen használni, amivel megdöntötte azt az elképzelést, hogy a tehenek egyszerű, eszköztelen állatok lennének...

MA 06:05

Történelmi események a mai napon (Március 27.)

Rövid visszatekintés a mai nap történelmi fordulópontjaira: a legtragikusabb légikatasztrófa Tenerife ködös kifutóján történt, Geronimo fegyverletételével lezárult az Apache-háborúk, és Typhoid Mary élete végéig karanténban maradt...

MA 06:01

Az űr súlytalanságában elkóborolnak az emberi spermiumok?

🚀 A legújabb kutatások szerint az emberi spermiumok meglepő módon nehezen boldogulnak az űrben tapasztalható mikrogravitációs környezetben...

csütörtök 21:57

Itt a beépített videóhívás: forradalom az üzenetküldésben

📺 Az SMS világa évek óta lemaradásban van az olyan modern alkalmazásokhoz képest, mint a WhatsApp vagy az iMessage, ahol könnyedén lehet váltani szöveges üzenetküldésről hívásra, és a formázási lehetőségek is jóval szabadabbak...

csütörtök 21:46

Az MI forradalmasítja a matekot: közeleg a gépi bizonyítás kora?

🧠 Külön említést érdemel, hogy egyre közelebb kerül a tudomány ahhoz, hogy matematikai bizonyításokat gépekkel ellenőrizzenek, garantálva ezzel azok helyességét...

csütörtök 21:23

Az EU górcső alá veszi a Snapchat gyerekvédelmi hibáit

🔍 Az Európai Unió hivatalos vizsgálatot indított a Snapchat működése kapcsán, mert felmerült a gyanú, hogy a platform nem tesz eleget a kiskorúak védelméért...

csütörtök 21:15

Az Intel Core Ultra 270K és 250K Plus jók, csak minden drága

Különösen igaz ez akkor, ha új gép építésén vagy fejlesztésén gondolkodsz: ma már nem elég egy jó ár-értékű processzort találni, hiszen a memória-, SSD- és videokártya-árak miatt minden PC-alkatrész nehezen elérhető „jó vétel”...

csütörtök 20:25

Az új Wi‑Fi 7 routerekbe tényleg megéri beruházni?

Például nemrég még felesleges pénzkidobásnak tartottam a Wi‑Fi 7 routerek beszerzését: túl drágák voltak, ráadásul csupán marketingfogásnak tűntek...

csütörtök 20:12

Az északi-sarki jégolvadás újabb ijesztő csúcsot döntött

🔥 Az északi-sarki tengeri jégtakaró idén ismét történelmi mélypontra zsugorodott, miután a téli növekedési időszak végén mindössze 14,29 millió km²-re terjedt ki...

csütörtök 20:01

A Pentagon új titkos fegyvere: az Xbox-kontroller

🕹 Az amerikai hadsereg legújabb csúcstechnológiás lézerfegyverei mögött egy egészen meglepő titok rejtőzik: nem más, mint a jól ismert Xbox-kontroller...

csütörtök 19:56

Az antiprotonok megindulnak: történelmi áttörés a CERN-ben

A CERN kutatói történelmi bravúrt hajtottak végre: először sikerült teherautón szállítaniuk egy antiprotonfelhőt...

csütörtök 19:44

A kínai AI-bizniszben ragadnak a Manus vezetői, miközben a Meta kaszál

Van itt egy kis kavar a kínai AI-szcénában! A Manus nevű, mesterséges intelligenciával foglalkozó startup Kínában indult, de tavaly áthelyezte bázisát és fő csapatát Szingapúrba...

csütörtök 19:34

Az új Meta-csomag tényleg megkönnyíti a vállalkozók életét?

💼 Érdekes fejlemény, hogy a Meta nagyszabású újítással igyekszik fellendíteni a kisvállalkozói szférát, miközben a mesterséges intelligencia térnyerése meghatározza az üzleti világ jövőját...

csütörtök 19:25

Az Intercom új MI-je letarolja az ügyfélszolgálati piacot

Felmerül a kérdés, hogy egy 15 éves, alapvetően ügyfélszolgálati platform hogyan tudja megelőzni a legnagyobb MI-óriásokat – mégis pontosan ezt állítja most az Intercom...

csütörtök 17:57

A Hold rejtett árnyéka pajzsként védhet az űrsugárzás ellen

A Hold felszínén eddig ismeretlen, kozmikus sugárzástól védett „üregre” bukkantak a kínai Chang’e–4 szonda adatai alapján...

csütörtök 17:47

A Mistral MI nagy dobása: ingyen adja hanggenerátorát

🎧 Az MI-alapú hangmegoldások piaca forrong, és mindenki az aranytojást tojó tyúkot keresi a vállalati ügyfelekért vívott harcban...

csütörtök 17:34

Az iPhone-okra vadászó Coruna-kémszoftver még veszélyesebb lett

Az iOS-t futtató eszközökre leselkedő veszélyek új szintre léptek: a Coruna nevű exploitkeretrendszer a korábbi, hírhedtté vált Operation Triangulation továbbfejlesztett változata, amely már az Apple legújabb A17 és M3 processzorait, valamint az iOS 17...

csütörtök 17:24

Az online csalók új csapdái: így védekezz most

Az online csalások ma már profi váltófutásra emlékeztetnek: különböző eszközök és szereplők alkotnak egy szövevényes láncot, amelyben mindenki a saját szakaszára specializálódott...

csütörtök 17:13

A biztonság rémálma: közeleg a kvantumszámítógépek kora?

A digitális világban egyre többen tartanak attól, hogy az MI önállósodása alapjaiban forgathatja fel a társadalmat...

csütörtök 17:01

A TikTokon tarol az új csaláshullám: üzleti fiókok a célpontok

💸 TikTok Business-fiókok estek visszaélések célpontjává egy új, kifinomult adathalász-támadásban. Az elkövetők olyan hamis weboldalakra csábítják az áldozatokat, amelyeket kifejezetten azért hoztak létre, hogy a biztonsági botok ne tudják felismerni őket...