Mi történik az MI-vel, ha töröljük a memóriáját?

Mi történik az MI-vel, ha töröljük a memóriáját?
A mesterséges intelligencia (MI) szédületes előretörése mögött bonyolult ideghálózatok állnak, amelyek két alapvető „képességre” támaszkodnak: a memorizálásra és a következtetésre. Az MI-fejlesztők régóta sejtik, hogy ezek a funkciók eltérő mechanizmusokkal működnek, de most először sikerült elkülöníteni őket egymástól – sőt, akár „műtétileg” ki is szedni az egyik képességet úgy, hogy a másik szinte sértetlen maradjon.

Mire emlékszik egy MI, és hogyan gondolkodik?

Az MI-k – például a GPT-5 nevű nagy nyelvi modell – egyszerre képesek híres idézeteket szinte szóról szóra visszaadni (memorizálás), és új problémákat kreatívan megoldani (következtetés). Egy új kutatás szerint ez a két képesség teljesen eltérő idegi útvonalakat használ a modell belsejében. Amikor a kutatók célzottan eltávolították a memorizálásért felelős hálózatrészeket, a modellek elvesztették a tanult adatok szinte tökéletes ismétlésének képességét – viszont a logikai feladatokat továbbra is csaknem változatlanul meg tudták oldani.

Egy példát is hoztak: egy modell 22. rétegében a súlykomponensek alsó 50 százaléka 23 százalékkal erősebben aktiválódott memorizált tartalmakra, míg a felső 10 százalék inkább az általános, nem memorizált szövegekre reagált. Ez a tiszta választóvonal tette lehetővé, hogy „kiszereljék” a memorizálást, de a többi funkciót megtartsák.

Nem elhanyagolható tényező, hogy az MI-k alapvető matematikai műveletekkel továbbra is küszködnek – még akkor is, ha elméletileg logikus gondolkodásra képesek. A mondás igaz: az MI inkább emlékszik arra, hogy 2 + 2 = 4, mintsem értené, hogy miért. Ez rámutat: jelenleg ezek a modellek a matematikát is memorizált tényként kezelik, nem valódi logikai műveletként.

Mit jelent mindez a gyakorlatban?

Noha a kutatók leginkább az Allen Institute OLMo-2 nevű nyelvi modelljén teszteltek – 1 és 7 milliárd paraméteres változatokon –, látványos eredményeket értek el. Amint eltávolították a memorizálásért felelős súlyokat, a modell képessége radikálisan visszaesett a tanult adatok visszaadására: 100 százalékról 3,4 százalékra. Eközben a logikai feladatok (például igaz/hamis eldöntése, ha–akkor szabályok alkalmazása, logikai dedukciós rejtvények, tárgykövetés, egyszerű tudományos és intuíciót igénylő kérdések megválaszolása) teljesítménye 95–106 százalék között maradt.

A spektrum azonban széles: egyes feladatok, például a matematikai műveletek és a „zárt könyv” típusú tudásvisszakeresés részben a memorizált útvonalakat használták, így ezek csak 66–86 százalékos szinten maradtak. A kutatók szerint a matematika különösen érzékeny; a modellek még akkor sem tudtak jól számolni, amikor a korábbi logikai lépéseiket hibátlanul követték, de a memorizálás „kiszerelése” után a számítási lépés összeomlott.

Az is kiderült, hogy míg a gyakori tények (például országfővárosok) aligha változtak a memóriatörlés után, addig a ritka adatok (mint egy cég vezérigazgatójának neve) akár 78 százalékkal is visszaeshettek. Ebből kifolyólag a modellek eltérő idegi erőforrásokat rendelnek az időnként előforduló, illetve a tömegesen tanult információkhoz.

Mennyire megbízható a memóriatörlés?

A Goodfire kutatócsapata az úgynevezett K-FAC technikát alkalmazta, amely hatásosabbnak bizonyult a korábbi memóriatörlő módszereknél. Például látható volt: amikor kontrolláltan történelmi idézeteket távolítottak el, a K-FAC csak 16,1 százalékát őrizte meg ezeknek, szemben a BalancedSubnet korábbi, 60 százalékos eredményével. A képfeldolgozó modellek, amikor szándékosan rosszul címkézett képeken tanultak, szintén elkülönítették a memorizált és a helyes mintákat.

Noha a technika látványos, nem tökéletes. Az egyszer törölt emlékek rendre visszatérhetnek, ha a modellt tovább tanítják. A jelenlegi módszerek legfeljebb „elnyomják” a már megtanult adatokat, de nem törlik véglegesen: egy újabb tanítási lépés elég az elveszettnek hitt tények újbóli előhívásához.

A kutatók azt sem tudják pontosan megmondani, miért vesznek el egyes képességek, például a matematikai képességek, annyira hirtelen. Az is lehet, hogy a memorizálás és a matematikai műveletek hasonló neuronhálózati útvonalakat használnak, ezért mindkettő csorbul a beavatkozás után. Emellett előfordulhat, hogy egyes összetett képességek memorizálásnak látszanak, noha valójában bonyolult logikai folyamatokat takarnak.


Merre tart az MI-neuronok feltérképezése?

Nem elhanyagolható tényező, hogy a kutatás új távlatokat nyit a mesterséges intelligencia fejlesztésében: elképzelhető, hogy a jövőben bármilyen bizalmas vagy szerzői joggal védett tartalmat eltávolíthatunk egy modellből anélkül, hogy a többi képessége megsérülne. Egyelőre azonban az MI-k neuronhálózatainak működése csak részben ismert, így ezek a technikák még nem kínálnak teljes biztonságot.

Az MI belső „tájainak” feltérképezése tehát most kezd igazán izgalmassá válni. A memorizálás és a következtetés elválasztásával közelebb kerülhetünk ahhoz, hogy megbízható, biztonságos és még jobb problémamegoldó mesterséges intelligenciák szülessenek.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

csütörtök 12:25

A 6 legbénább szexuális célzás a marketing történelemben

A szex használata a reklámban egyidős annak létrejöttével. Ezer százalék, hogy az első reklámban ami az első kereket reklámozta, rögtön kettőt raktak egymás mellé, hogy egy pár cickóra hasonlítson...

kedd 14:10

Egy könyvvel az ellenség szívéhez – Franklin megdöbbentő módszere

Egy nap eszébe jutott valami merész és szokatlan. Tudta, hogy ellenfelének könyvtárában számos ritka és értékes kötet található, melyekre nagy becsben tartott, és az is köztudott volt, hogy igazi büszkesége egyik különleges könyv volt, amelyet csak kevesen olvashattak...

MA 10:23

Kanada elvesztette a kanyarómentes státuszát: újra terjed a járvány

😷 Kanada hivatalosan elvesztette a kanyarómentes státuszát, miután a 2024-ben kezdődött, hosszan tartó járvány megszakítás nélkül terjed az országban...

MA 10:16

Az intersztelláris üstökös nem földönkívüli, mégis izgalmasabb

Az űrkutatás világában fel-fellángolnak a találgatások, amikor egy új égi jelenség tűnik fel, és az idegenek témája szinte mindig előkerül...

MA 09:57

Kanada elveszítette a kanyarómentességet, újra itt a járvány

😷 Kanada 1998-ban még teljesen felszámolta a kanyarót, most azonban a rendkívül fertőző vírus ismét endémiásnak számít az országban...

MA 09:51

Homerek özöne lepi el Springfieldet, új Fortnite-őrület söpör végig

😂 Több mint egy hét telt el azóta, hogy Springfield beköltözött a Fortnite-ba, és máris őrületes újdonságok érkeznek...

MA 09:43

Az új MI-s Google Home, káosz vagy valódi okosotthon?

A Google új, MI-alapú Gemini hangasszisztensét fokozatosan vezetik be az okoskijelzőkre és okoshangszórókra, de a felhasználói tapasztalatok alapján egyelőre rengeteg a zavar és a hiányosság...

MA 09:37

Már az MI irányítja az első műholdat az űrben

🚀 Külön figyelmet érdemel, hogy először sikerült mesterségesintelligencia-alapú vezérlővel irányítani egy műhold helyzetét az űrben...

MA 09:29

Az agy vegyülete, amely a gyermekkori traumákat őrzi

Amerikai és kanadai kutatók egy korábban ismeretlen agyi vegyület, az SGK1 fehérje szerepét tárták fel a depresszió és az öngyilkossági gondolatok kialakulásában olyan embereknél, akik gyermekként traumát vagy komoly nehézségeket éltek át...

MA 09:15

Az új Tesla-trükk: bérlés napi 22 ezerért, Hertznek annyi?

A Tesla riválisként lép be az autókölcsönzés piacára: mostantól San Diegóban és Costa Mesában három-négy napra is bérelhetők Teslák, már napi 22 ezer forinttól (60 USD)...

MA 09:09

Az FDA leveszi a veszélyjelzést a változókori hormonkezelésekről

💪 Az Egyesült Államok Élelmiszer- és Gyógyszerügyi Hivatala (FDA) visszavonta a menopauza (változókor) idején alkalmazott hormonpótló terápiák (HRT) korábban alkalmazott, úgynevezett fekete dobozos egészségügyi figyelmeztetéseit...

MA 09:01

Az új Firefox végre keresztbe tesz a digitális nyomkövetőknek

🔒 A Firefox 145-ös verziójába érkező frissítés tovább nehezíti az internetezők követését digitális ujjlenyomat‑alapú módszerekkel...

MA 08:51

Az ókori paróka titka: 3400 éves egyiptomi hajzselé

Több mint három évezreddel ezelőtt Luxorban, az ókori Théba városában temették el Merit asszonyt, fején egy különleges, emberi hajból készült parókával...

MA 08:37

Az ősi kelta koponyafúró szerszám újra előkerült Lengyelországban

Lengyel régészek egy különleges, 2300 éves, vaskori koponyafúró szerszámot találtak a közép-kelet-lengyelországi Mazóvia régiójában, Ysa Gra kelta településén...

MA 08:16

A Kaltura felvásárolta az izraeli MI-alapú avatarokat készítő eSelfet

👤 A New York-i székhelyű Kaltura, egy MI-vezérelt videóplatform, 27 millió dollárért (kb...

MA 08:08

Az új fogkrém: hajból készült csoda a lyukas fogak ellen?

😱 Váratlan helyről érkezhet a fogápolás forradalma: akár a saját hajadból származó fogkrémet is használhatsz a jövőben!..

MA 08:02

Az ősi Windows-játékokat mostantól Linuxon is játszhatod

🎮 Egy lelkes fejlesztő új, nyílt forráskódú projektet indított, amellyel rengeteg klasszikus Windows-játék futtatható Linuxon...

MA 07:58

Az idei Sony-rekord: árad a profit a zenéből és a képfeldolgozásból

🎵 A Sony idén újabb nyereségi csúcsot döntött meg, miután a zenei és képfeldolgozó részlegei szárnyalni kezdtek...

MA 07:50

Az új PDF-korszak: jön a JPEG XL támogatás

A PDF Association új életet lehel a JPEG XL képformátumba, amelyet a Google néhány éve elavultnak nyilvánított, majd eltávolított a Chromiumból...