Mi történik az MI-vel, ha töröljük a memóriáját?

Mi történik az MI-vel, ha töröljük a memóriáját?
A mesterséges intelligencia (MI) szédületes előretörése mögött bonyolult ideghálózatok állnak, amelyek két alapvető „képességre” támaszkodnak: a memorizálásra és a következtetésre. Az MI-fejlesztők régóta sejtik, hogy ezek a funkciók eltérő mechanizmusokkal működnek, de most először sikerült elkülöníteni őket egymástól – sőt, akár „műtétileg” ki is szedni az egyik képességet úgy, hogy a másik szinte sértetlen maradjon.

Mire emlékszik egy MI, és hogyan gondolkodik?

Az MI-k – például a GPT-5 nevű nagy nyelvi modell – egyszerre képesek híres idézeteket szinte szóról szóra visszaadni (memorizálás), és új problémákat kreatívan megoldani (következtetés). Egy új kutatás szerint ez a két képesség teljesen eltérő idegi útvonalakat használ a modell belsejében. Amikor a kutatók célzottan eltávolították a memorizálásért felelős hálózatrészeket, a modellek elvesztették a tanult adatok szinte tökéletes ismétlésének képességét – viszont a logikai feladatokat továbbra is csaknem változatlanul meg tudták oldani.

Egy példát is hoztak: egy modell 22. rétegében a súlykomponensek alsó 50 százaléka 23 százalékkal erősebben aktiválódott memorizált tartalmakra, míg a felső 10 százalék inkább az általános, nem memorizált szövegekre reagált. Ez a tiszta választóvonal tette lehetővé, hogy „kiszereljék” a memorizálást, de a többi funkciót megtartsák.

Nem elhanyagolható tényező, hogy az MI-k alapvető matematikai műveletekkel továbbra is küszködnek – még akkor is, ha elméletileg logikus gondolkodásra képesek. A mondás igaz: az MI inkább emlékszik arra, hogy 2 + 2 = 4, mintsem értené, hogy miért. Ez rámutat: jelenleg ezek a modellek a matematikát is memorizált tényként kezelik, nem valódi logikai műveletként.

Mit jelent mindez a gyakorlatban?

Noha a kutatók leginkább az Allen Institute OLMo-2 nevű nyelvi modelljén teszteltek – 1 és 7 milliárd paraméteres változatokon –, látványos eredményeket értek el. Amint eltávolították a memorizálásért felelős súlyokat, a modell képessége radikálisan visszaesett a tanult adatok visszaadására: 100 százalékról 3,4 százalékra. Eközben a logikai feladatok (például igaz/hamis eldöntése, ha–akkor szabályok alkalmazása, logikai dedukciós rejtvények, tárgykövetés, egyszerű tudományos és intuíciót igénylő kérdések megválaszolása) teljesítménye 95–106 százalék között maradt.

A spektrum azonban széles: egyes feladatok, például a matematikai műveletek és a „zárt könyv” típusú tudásvisszakeresés részben a memorizált útvonalakat használták, így ezek csak 66–86 százalékos szinten maradtak. A kutatók szerint a matematika különösen érzékeny; a modellek még akkor sem tudtak jól számolni, amikor a korábbi logikai lépéseiket hibátlanul követték, de a memorizálás „kiszerelése” után a számítási lépés összeomlott.

Az is kiderült, hogy míg a gyakori tények (például országfővárosok) aligha változtak a memóriatörlés után, addig a ritka adatok (mint egy cég vezérigazgatójának neve) akár 78 százalékkal is visszaeshettek. Ebből kifolyólag a modellek eltérő idegi erőforrásokat rendelnek az időnként előforduló, illetve a tömegesen tanult információkhoz.

Mennyire megbízható a memóriatörlés?

A Goodfire kutatócsapata az úgynevezett K-FAC technikát alkalmazta, amely hatásosabbnak bizonyult a korábbi memóriatörlő módszereknél. Például látható volt: amikor kontrolláltan történelmi idézeteket távolítottak el, a K-FAC csak 16,1 százalékát őrizte meg ezeknek, szemben a BalancedSubnet korábbi, 60 százalékos eredményével. A képfeldolgozó modellek, amikor szándékosan rosszul címkézett képeken tanultak, szintén elkülönítették a memorizált és a helyes mintákat.

Noha a technika látványos, nem tökéletes. Az egyszer törölt emlékek rendre visszatérhetnek, ha a modellt tovább tanítják. A jelenlegi módszerek legfeljebb „elnyomják” a már megtanult adatokat, de nem törlik véglegesen: egy újabb tanítási lépés elég az elveszettnek hitt tények újbóli előhívásához.

A kutatók azt sem tudják pontosan megmondani, miért vesznek el egyes képességek, például a matematikai képességek, annyira hirtelen. Az is lehet, hogy a memorizálás és a matematikai műveletek hasonló neuronhálózati útvonalakat használnak, ezért mindkettő csorbul a beavatkozás után. Emellett előfordulhat, hogy egyes összetett képességek memorizálásnak látszanak, noha valójában bonyolult logikai folyamatokat takarnak.


Merre tart az MI-neuronok feltérképezése?

Nem elhanyagolható tényező, hogy a kutatás új távlatokat nyit a mesterséges intelligencia fejlesztésében: elképzelhető, hogy a jövőben bármilyen bizalmas vagy szerzői joggal védett tartalmat eltávolíthatunk egy modellből anélkül, hogy a többi képessége megsérülne. Egyelőre azonban az MI-k neuronhálózatainak működése csak részben ismert, így ezek a technikák még nem kínálnak teljes biztonságot.

Az MI belső „tájainak” feltérképezése tehát most kezd igazán izgalmassá válni. A memorizálás és a következtetés elválasztásával közelebb kerülhetünk ahhoz, hogy megbízható, biztonságos és még jobb problémamegoldó mesterséges intelligenciák szülessenek.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

csütörtök 12:25

A 6 legbénább szexuális célzás a marketing történelemben

A szex használata a reklámban egyidős annak létrejöttével. Ezer százalék, hogy az első reklámban ami az első kereket reklámozta, rögtön kettőt raktak egymás mellé, hogy egy pár cickóra hasonlítson...

kedd 14:10

Egy könyvvel az ellenség szívéhez – Franklin megdöbbentő módszere

Egy nap eszébe jutott valami merész és szokatlan. Tudta, hogy ellenfelének könyvtárában számos ritka és értékes kötet található, melyekre nagy becsben tartott, és az is köztudott volt, hogy igazi büszkesége egyik különleges könyv volt, amelyet csak kevesen olvashattak...

MA 12:01

Nincs bizonyíték az acetaminofen és az autizmus kapcsolatára

Az utóbbi években egyre többen aggódtak amiatt, hogy a terhesség alatti acetaminofen (közismert nevén paracetamol; angolul Tylenol) használata növelheti a gyermekeknél az autizmus vagy az ADHD kialakulásának kockázatát...

MA 11:53

Feltárták Peru egyik legrejtélyesebb piacának titkát

Peru déli részén, a Pisco-völgy szélén évtizedek óta rejtélyes látvány fogadja az odalátogatót: Monte Sierpe, vagyis a „Lyuksor”, több mint 5000 tökéletesen sorba rendezett gödröt vonultat fel a kopár domboldalon...

MA 11:42

Az MI-cégek sorra kiszivárogtatják titkos API-kulcsaikat

🔒 A Wiz felhőbiztonsági vállalat figyelmeztet: a legnagyobb MI-cégek sem kezelik jobban a saját titkaikat, mint bármely más szoftverfejlesztő...

MA 11:31

Újabb áremelés a Paramount Plusnál: vége az ingyenes próbának is

💸 2026 elején ismét drágul a Paramount Plus: az Essential csomag havi díja 2 950 forintról 3 300 forintra, a reklámmentes Premium csomagé pedig 4 800 forintról 5 150 forintra nő...

MA 11:22

Az anyanyelv hatással van arra, hogyan olvasunk

📖 Az olvasás egész életünkön át elkísér, a sikeres beilleszkedés pedig gyakran múlik azon, mennyire tudunk gördülékenyen olvasni egy új ország nyelvén...

MA 11:11

Az MI végre beköltözik a Google TV Streamerbe

🤖 A Google újabb szintre emeli a Google TV Streamer élményét: mostantól a Gemini nevű MI-asszisztens is elérhető rajta...

MA 11:01

Az igazi hackerkirály kitálal: így működik a kiberbűnözés

A kibervilág egyik legnagyobb bűnözője, Vjacseszlav „Tank” Pencsukov most börtönből meséli el, hogyan szerveződtek a modern hekkercsoportok, és milyen hibák vezettek a lebukásához...

MA 10:58

Az MI agyában a memorizálás és a gondolkodás másként működik

💡 Amikor a mérnökök hatalmas nyelvi modelleket, például a GPT-5-öt fejlesztenek, két látványosan eltérő képesség bukkan fel: a memorizálás, vagyis a már látott szövegek pontos visszamondása – ilyenek például idézetek vagy regényrészletek –, és az érvelés, azaz amikor a modell új helyzetekben próbál elvont összefüggések alapján megoldani problémákat...

MA 10:51

A Neutron rakéta bemutatását 2026-ra halasztják

🚀 A Rocket Lab közepes teherbírású Neutron rakétájának első indítását ismét elhalasztották; a vállalat tervei szerint legkorábban 2026 nyarán kezdődhetnek meg a próbarepülések...

MA 10:44

Észak-koreai hackerek egy gombnyomással törölhetik az Androidodat

🕵 Az utóbbi hetekben Észak-Korea hírhedt APT37-es hackercsoportja új módszerrel támad dél-koreai célpontokat: a Google Eszközkereső (Find My Device) szolgáltatást használják arra, hogy Android-készülékeket távolról töröljenek, ellehetetlenítve az áldozatok hozzáférését adataikhoz...

MA 10:37

A Gemini asszisztens lassan indul, a Google Home még zűrzavaros

💡 A Google okosotthonos eszközein új szakasz kezdődött: a lassan elérhetővé váló Gemini hangasszisztens átveszi az irányítást a Google Home hangszórói és kijelzői felett...

MA 10:30

Izraeli MI-avatárok tarolnak, a Kaltura ismét nagyot lépett

A New York-i székhelyű, MI-alapú videoplatformjairól ismert Kaltura idén közel 10 milliárd forintért (27 millió USD, kb...

MA 10:23

Kanada elvesztette a kanyarómentes státuszát: újra terjed a járvány

😷 Kanada hivatalosan elvesztette a kanyarómentes státuszát, miután a 2024-ben kezdődött, hosszan tartó járvány megszakítás nélkül terjed az országban...

MA 10:16

Az intersztelláris üstökös nem földönkívüli, mégis izgalmasabb

Az űrkutatás világában fel-fellángolnak a találgatások, amikor egy új égi jelenség tűnik fel, és az idegenek témája szinte mindig előkerül...

MA 09:57

Kanada elveszítette a kanyarómentességet, újra itt a járvány

😷 Kanada 1998-ban még teljesen felszámolta a kanyarót, most azonban a rendkívül fertőző vírus ismét endémiásnak számít az országban...

MA 09:51

Homerek özöne lepi el Springfieldet, új Fortnite-őrület söpör végig

😂 Több mint egy hét telt el azóta, hogy Springfield beköltözött a Fortnite-ba, és máris őrületes újdonságok érkeznek...

MA 09:43

Az új MI-s Google Home, káosz vagy valódi okosotthon?

A Google új, MI-alapú Gemini hangasszisztensét fokozatosan vezetik be az okoskijelzőkre és okoshangszórókra, de a felhasználói tapasztalatok alapján egyelőre rengeteg a zavar és a hiányosság...