2025. 11. 11., 08:45

Mi történik az MI-vel, ha töröljük a memóriáját?

Mi történik az MI-vel, ha töröljük a memóriáját?
A mesterséges intelligencia (MI) szédületes előretörése mögött bonyolult ideghálózatok állnak, amelyek két alapvető „képességre” támaszkodnak: a memorizálásra és a következtetésre. Az MI-fejlesztők régóta sejtik, hogy ezek a funkciók eltérő mechanizmusokkal működnek, de most először sikerült elkülöníteni őket egymástól – sőt, akár „műtétileg” ki is szedni az egyik képességet úgy, hogy a másik szinte sértetlen maradjon.

Mire emlékszik egy MI, és hogyan gondolkodik?

Az MI-k – például a GPT-5 nevű nagy nyelvi modell – egyszerre képesek híres idézeteket szinte szóról szóra visszaadni (memorizálás), és új problémákat kreatívan megoldani (következtetés). Egy új kutatás szerint ez a két képesség teljesen eltérő idegi útvonalakat használ a modell belsejében. Amikor a kutatók célzottan eltávolították a memorizálásért felelős hálózatrészeket, a modellek elvesztették a tanult adatok szinte tökéletes ismétlésének képességét – viszont a logikai feladatokat továbbra is csaknem változatlanul meg tudták oldani.

Egy példát is hoztak: egy modell 22. rétegében a súlykomponensek alsó 50 százaléka 23 százalékkal erősebben aktiválódott memorizált tartalmakra, míg a felső 10 százalék inkább az általános, nem memorizált szövegekre reagált. Ez a tiszta választóvonal tette lehetővé, hogy „kiszereljék” a memorizálást, de a többi funkciót megtartsák.

Nem elhanyagolható tényező, hogy az MI-k alapvető matematikai műveletekkel továbbra is küszködnek – még akkor is, ha elméletileg logikus gondolkodásra képesek. A mondás igaz: az MI inkább emlékszik arra, hogy 2 + 2 = 4, mintsem értené, hogy miért. Ez rámutat: jelenleg ezek a modellek a matematikát is memorizált tényként kezelik, nem valódi logikai műveletként.

Mit jelent mindez a gyakorlatban?

Noha a kutatók leginkább az Allen Institute OLMo-2 nevű nyelvi modelljén teszteltek – 1 és 7 milliárd paraméteres változatokon –, látványos eredményeket értek el. Amint eltávolították a memorizálásért felelős súlyokat, a modell képessége radikálisan visszaesett a tanult adatok visszaadására: 100 százalékról 3,4 százalékra. Eközben a logikai feladatok (például igaz/hamis eldöntése, ha–akkor szabályok alkalmazása, logikai dedukciós rejtvények, tárgykövetés, egyszerű tudományos és intuíciót igénylő kérdések megválaszolása) teljesítménye 95–106 százalék között maradt.

A spektrum azonban széles: egyes feladatok, például a matematikai műveletek és a „zárt könyv” típusú tudásvisszakeresés részben a memorizált útvonalakat használták, így ezek csak 66–86 százalékos szinten maradtak. A kutatók szerint a matematika különösen érzékeny; a modellek még akkor sem tudtak jól számolni, amikor a korábbi logikai lépéseiket hibátlanul követték, de a memorizálás „kiszerelése” után a számítási lépés összeomlott.

Az is kiderült, hogy míg a gyakori tények (például országfővárosok) aligha változtak a memóriatörlés után, addig a ritka adatok (mint egy cég vezérigazgatójának neve) akár 78 százalékkal is visszaeshettek. Ebből kifolyólag a modellek eltérő idegi erőforrásokat rendelnek az időnként előforduló, illetve a tömegesen tanult információkhoz.

Mennyire megbízható a memóriatörlés?

A Goodfire kutatócsapata az úgynevezett K-FAC technikát alkalmazta, amely hatásosabbnak bizonyult a korábbi memóriatörlő módszereknél. Például látható volt: amikor kontrolláltan történelmi idézeteket távolítottak el, a K-FAC csak 16,1 százalékát őrizte meg ezeknek, szemben a BalancedSubnet korábbi, 60 százalékos eredményével. A képfeldolgozó modellek, amikor szándékosan rosszul címkézett képeken tanultak, szintén elkülönítették a memorizált és a helyes mintákat.

Noha a technika látványos, nem tökéletes. Az egyszer törölt emlékek rendre visszatérhetnek, ha a modellt tovább tanítják. A jelenlegi módszerek legfeljebb „elnyomják” a már megtanult adatokat, de nem törlik véglegesen: egy újabb tanítási lépés elég az elveszettnek hitt tények újbóli előhívásához.

A kutatók azt sem tudják pontosan megmondani, miért vesznek el egyes képességek, például a matematikai képességek, annyira hirtelen. Az is lehet, hogy a memorizálás és a matematikai műveletek hasonló neuronhálózati útvonalakat használnak, ezért mindkettő csorbul a beavatkozás után. Emellett előfordulhat, hogy egyes összetett képességek memorizálásnak látszanak, noha valójában bonyolult logikai folyamatokat takarnak.


Merre tart az MI-neuronok feltérképezése?

Nem elhanyagolható tényező, hogy a kutatás új távlatokat nyit a mesterséges intelligencia fejlesztésében: elképzelhető, hogy a jövőben bármilyen bizalmas vagy szerzői joggal védett tartalmat eltávolíthatunk egy modellből anélkül, hogy a többi képessége megsérülne. Egyelőre azonban az MI-k neuronhálózatainak működése csak részben ismert, így ezek a technikák még nem kínálnak teljes biztonságot.

Az MI belső „tájainak” feltérképezése tehát most kezd igazán izgalmassá válni. A memorizálás és a következtetés elválasztásával közelebb kerülhetünk ahhoz, hogy megbízható, biztonságos és még jobb problémamegoldó mesterséges intelligenciák szülessenek.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Lively Letters – Phonics (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ImgRef (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) ContactVault Pro (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) FormatX: Video Audio Converter...

APP
péntek 09:11

APPok, Amik Ingyenesek MA, 6/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     FormatX: Video Audio Converter (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) War Mongrels (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Monthly Dystopia...

APP
csütörtök 09:11

APPok, Amik Ingyenesek MA, 6/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp:...

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...