Az MI agyában a memorizálás és a gondolkodás másként működik

Az MI agyában a memorizálás és a gondolkodás másként működik
Amikor a mérnökök hatalmas nyelvi modelleket, például a GPT-5-öt fejlesztenek, két látványosan eltérő képesség bukkan fel: a memorizálás, vagyis a már látott szövegek pontos visszamondása – ilyenek például idézetek vagy regényrészletek –, és az érvelés, azaz amikor a modell új helyzetekben próbál elvont összefüggések alapján megoldani problémákat. Egy mostani kutatás először mutatta ki, hogy ez a két funkció ténylegesen eltérő neurális útvonalakon valósul meg a modell szerkezetében. Külön figyelmet érdemel, hogy a szétválasztás meglepően tisztán sikerült. A kutatók manipulálták a modelleket: amikor kiszedték a memorizálásért felelős idegpályákat, a modellek 97 százalékkal gyengébben idézték vissza a tanítóadatokat, de a logikus gondolkodási képességeik szinte változatlanul megmaradtak.

Az MI és a számolás: memorizált tény vagy logikus művelet?

A nyelvi modellek – némileg meglepő módon – nehezen teljesítenek matematikai feladatokat, ha nem használnak külső segédeszközt. Inkább visszamondják a megtanult számtáblákat, ahelyett hogy ténylegesen kiszámítanák az eredményt, mint például egy tanuló, aki csak magolja a szorzótáblát. Ez arra utal, hogy a mostani modellek számára a 2+2=4 inkább memorizált tény, mint egy elemi matematikai összefüggés.

Noha az MI-kutatók által használt „érvelés” fogalma nem pontosan egyezik azzal, amit emberi gondolkodás alatt értünk, a mostani vizsgálatban épségben maradt gondolkodási képességek közé tartozik például az igaz–hamis állítások vizsgálata vagy a „ha–akkor” típusú szabályok követése. Ezek nem igényelnek valódi kreativitást vagy elmélyült problémamegoldást, inkább korábban megtanult sémák felismeréséről szólnak, míg az elvontabb, matematikai következtetés ma még kívül esik e modellek lehetőségein.

Adatkitörlés: potenciális védelem a jövő MI-jeiben?

A módszer jövőbeli továbbfejlesztése akár lehetővé teheti, hogy a fejlesztők szelektíven távolítsanak el szerzői jogi védelem alatt álló vagy érzékeny adatokat egy MI-ből anélkül, hogy az elveszítené további hasznos funkcióit. Noha a neurális hálókban az információ elosztott módon, sokszor bonyolultan tárolódik, és jelenleg a teljes törlés még nem garantált, a kutatás fontos első lépés ezen az úton.

Az MI tájképén végighaladva: hogyan láttatják az idegpályák a tudást?

A kutatás központi fogalma a „veszteségtáj” (loss landscape): ez a modell pontatlanságainak változását térképezi fel, ahogy milliónyi belső kapcsoló – az ún. súlyok – értéke módosul. Képzelj el egy dombos-völgyes terepet, ahol a lejtők a hibaarányt mutatják: a modellek a tanítás során mindig a lejtőn lefelé gurulnak, a hibák csökkenése felé.

A kutatók azt vizsgálták, mennyire érzékeny a teljesítmény a súlyok apró módosításaira – azaz mennyire „hegyes” vagy „sima” egy-egy irányban a táj. Egyetlen memorizált tény éles csúcsot eredményez, de ezek mind másfelé állnak, így összesítve lapossá válnak. Az érvelés – amit számos különböző kérdésnél lehet használni – inkább széles, azonos irányú dombokat képez, amelyek megmaradnak az átlagolás során is.


Minden MI másként őrzi a tudását

A tapasztalatokat több különböző rendszerrel ellenőrizték: például az Allen Institute OLMo-2 modelljeivel, amelyeknek minden súlya és tanítóadata nyilvános. Képelemző rendszereken is futottak próbákat: a kutatók direkt összekevert címkékkel tanítottak be egy 86 millió paraméteres Vision Transformert, hogy ellenőrzött módon idézzenek elő memorizálást.

Az eljárással a memorizált tartalmak szó szerinti visszaidézési aránya 3,4 százalékra esett, míg a logikus gondolkodási feladatok 95–106 százalékos szinten maradtak. Ezekben olyan tesztek szerepeltek, mint logikai kifejezések értékelése, dedukciós feladványok (például „A magasabb B-nél”), tárgyak követése cseréket követően, illetve ismerős MI-benchmarkfeladatok.

Noha a logikai gondolkodás szívós maradt, a matematikai műveletek, illetve a lexikális tudás (pl. országok fővárosai) teljesítménye jelentősen csökkent, akár harmadával–ötödével is. A modellek tehát még mindig inkább példákat memorizálnak, mintsem szabályokat alkalmaznának, például összeadáskor. A nyílt könyves (open-book) típusú kérdések, amelyek a kérdésben adott információ felhasználásán alapulnak, kevésbé sérültek.

Külön figyelmet érdemel, hogy az információ típusa is számít: a gyakori tudáselemek sérülnek a legkevésbé, a ritkák (pl. vállalatok vezérigazgatói) pedig akár 78 százalékban is kieshetnek törléskor.

A K-FAC (Kronecker-Factored Approximate Curvature) eljárás messze felülmúlta a korábbi, a memorizálást kiirtó módszereket, miközben nem volt szükség kézzel gyűjtött példákra.

Az emlékezet törlésének végső határai

Noha biztatóak az eredmények, a kutatók hangsúlyozzák: egyelőre nem lehet teljesen kiirtani a tanult tartalmakat. A törölt emlékek könnyen visszajöhetnek, ha az MI-t néhány további körben újra betanítják. A műszaki háttér egyes szélsőséges esetekben (például nagyon lapos vagy nagyon hegyes vidéken) bizonytalan adatokat szolgáltathat – szerencsére ez nem befolyásolja a törlés hatékonyságát.

Összefoglalásként megjegyezhető, hogy az MI-modellekben a memorizálás és az érvelés tényleg külön utakon fut, és ez a felfedezés jelentősen javíthatja a jövőbeli rendszerek átláthatóságát, szerkeszthetőségét és adatvédelmét.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

csütörtök 12:25

A 6 legbénább szexuális célzás a marketing történelemben

A szex használata a reklámban egyidős annak létrejöttével. Ezer százalék, hogy az első reklámban ami az első kereket reklámozta, rögtön kettőt raktak egymás mellé, hogy egy pár cickóra hasonlítson...

kedd 14:10

Egy könyvvel az ellenség szívéhez – Franklin megdöbbentő módszere

Egy nap eszébe jutott valami merész és szokatlan. Tudta, hogy ellenfelének könyvtárában számos ritka és értékes kötet található, melyekre nagy becsben tartott, és az is köztudott volt, hogy igazi büszkesége egyik különleges könyv volt, amelyet csak kevesen olvashattak...

MA 14:11

Az új lopási trükk: Quantum Route Redirect garázdálkodik

🔒 A legújabb adathalászat automatizálása, a Quantum Route Redirect (QRR), mintegy ezer különböző domaint használ a Microsoft 365-fiókok bejelentkezési adatainak ellopására világszerte...

MA 13:53

Az új Rodecaster Video S kompakt videóstúdió minden alkotónak

A Rodecaster keverőasztalok már régóta alapdarabjai a podcasterek és tartalomkészítők asztalának...

MA 13:42

A vegán étrend valóban megfelezi az ökológiai lábnyomot

A vegán életmód előretörése világszerte egyre feltűnőbb, és úgy tűnik, nemcsak egészségügyi, hanem környezeti szempontból is egyedülálló előnyöket kínál...

MA 13:31

Az MI végre fordít a telefonodon, nem kell felhő!

📱 A Broadcom új MI-chipsetet mutatott be, amely valós időben képes hangfordításra, ráadásul minden feladatot közvetlenül az eszközön hajt végre, internetkapcsolat nélkül...

MA 13:21

Az ázsiai óriás végre fékezi a szén-dioxid-kibocsátást?

Kína szén-dioxid-kibocsátása az elmúlt 18 hónapban stagnált vagy csökkent, ami arra utal, hogy a világ legnagyobb szennyezője a vártnál jóval hamarabb érte el a kibocsátási csúcsot...

MA 13:11

Az áttörés: önpusztításra késztethető a prosztatarák

💣 A nemzetközi kutatócsapat egy eddig rejtett sebezhetőséget fedezett fel a prosztatarák sejtjeiben, ami hatékonyabb kezelési lehetőségekhez vezethet e gyakori férfi daganat esetében...

MA 13:02

Az Intuitive Machines belép az űrvédelmi iparba

🚀 Az Intuitive Machines komoly lépést tett az űripar nagyjai felé, miután bejelentette egy 294 milliárd forint (800 millió USD) értékű felvásárlási szándékát...

MA 12:52

Az Apple M1 csip ismét megmentette a Macet

💻 Amikor 2020 novemberében elindult az első, saját tervezésű M1 processzoros Mac, óriási fordulatot vett az Apple legrégebbi platformjának története...

MA 12:42

Az univerzum már túl van a fénykorán, közeleg a hideg csend

🌌 A csillagászok most először tudták megerősíteni, hogy az univerzum csillagkeletkezési időszaka már leáldozott, és a világegyetem egyre hidegebb, élettelenebb hellyé válik...

MA 12:22

Az új MI-korszak: megérkezik a Nano Banana 2

🍌 A Google ismét forradalmasítani készül az MI-alapú képgenerálást a Nano Banana 2-vel, amely hamarosan elérhető lesz a Gemini alkalmazásban...

MA 12:10

Az elbukott hekkervilág királya kitálal a kiberbűnözésről

A kiberbűnözés titkos világába enged betekintést Vjacseszlav “Tank” Pencsukov, aki éveken át meghatározó szereplője volt az online bűnözésnek...

MA 12:01

Nincs bizonyíték az acetaminofen és az autizmus kapcsolatára

Az utóbbi években egyre többen aggódtak amiatt, hogy a terhesség alatti acetaminofen (közismert nevén paracetamol; angolul Tylenol) használata növelheti a gyermekeknél az autizmus vagy az ADHD kialakulásának kockázatát...

MA 11:53

Feltárták Peru egyik legrejtélyesebb piacának titkát

Peru déli részén, a Pisco-völgy szélén évtizedek óta rejtélyes látvány fogadja az odalátogatót: Monte Sierpe, vagyis a „Lyuksor”, több mint 5000 tökéletesen sorba rendezett gödröt vonultat fel a kopár domboldalon...

MA 11:42

Az MI-cégek sorra kiszivárogtatják titkos API-kulcsaikat

🔒 A Wiz felhőbiztonsági vállalat figyelmeztet: a legnagyobb MI-cégek sem kezelik jobban a saját titkaikat, mint bármely más szoftverfejlesztő...

MA 11:31

Újabb áremelés a Paramount Plusnál: vége az ingyenes próbának is

💸 2026 elején ismét drágul a Paramount Plus: az Essential csomag havi díja 2 950 forintról 3 300 forintra, a reklámmentes Premium csomagé pedig 4 800 forintról 5 150 forintra nő...

MA 11:22

Az anyanyelv hatással van arra, hogyan olvasunk

📖 Az olvasás egész életünkön át elkísér, a sikeres beilleszkedés pedig gyakran múlik azon, mennyire tudunk gördülékenyen olvasni egy új ország nyelvén...

MA 11:11

Az MI végre beköltözik a Google TV Streamerbe

🤖 A Google újabb szintre emeli a Google TV Streamer élményét: mostantól a Gemini nevű MI-asszisztens is elérhető rajta...