2025. 11. 11., 10:58

Az MI agyában a memorizálás és a gondolkodás másként működik

Az MI agyában a memorizálás és a gondolkodás másként működik
Amikor a mérnökök hatalmas nyelvi modelleket, például a GPT-5-öt fejlesztenek, két látványosan eltérő képesség bukkan fel: a memorizálás, vagyis a már látott szövegek pontos visszamondása – ilyenek például idézetek vagy regényrészletek –, és az érvelés, azaz amikor a modell új helyzetekben próbál elvont összefüggések alapján megoldani problémákat. Egy mostani kutatás először mutatta ki, hogy ez a két funkció ténylegesen eltérő neurális útvonalakon valósul meg a modell szerkezetében. Külön figyelmet érdemel, hogy a szétválasztás meglepően tisztán sikerült. A kutatók manipulálták a modelleket: amikor kiszedték a memorizálásért felelős idegpályákat, a modellek 97 százalékkal gyengébben idézték vissza a tanítóadatokat, de a logikus gondolkodási képességeik szinte változatlanul megmaradtak.

Az MI és a számolás: memorizált tény vagy logikus művelet?

A nyelvi modellek – némileg meglepő módon – nehezen teljesítenek matematikai feladatokat, ha nem használnak külső segédeszközt. Inkább visszamondják a megtanult számtáblákat, ahelyett hogy ténylegesen kiszámítanák az eredményt, mint például egy tanuló, aki csak magolja a szorzótáblát. Ez arra utal, hogy a mostani modellek számára a 2+2=4 inkább memorizált tény, mint egy elemi matematikai összefüggés.

Noha az MI-kutatók által használt „érvelés” fogalma nem pontosan egyezik azzal, amit emberi gondolkodás alatt értünk, a mostani vizsgálatban épségben maradt gondolkodási képességek közé tartozik például az igaz–hamis állítások vizsgálata vagy a „ha–akkor” típusú szabályok követése. Ezek nem igényelnek valódi kreativitást vagy elmélyült problémamegoldást, inkább korábban megtanult sémák felismeréséről szólnak, míg az elvontabb, matematikai következtetés ma még kívül esik e modellek lehetőségein.

Adatkitörlés: potenciális védelem a jövő MI-jeiben?

A módszer jövőbeli továbbfejlesztése akár lehetővé teheti, hogy a fejlesztők szelektíven távolítsanak el szerzői jogi védelem alatt álló vagy érzékeny adatokat egy MI-ből anélkül, hogy az elveszítené további hasznos funkcióit. Noha a neurális hálókban az információ elosztott módon, sokszor bonyolultan tárolódik, és jelenleg a teljes törlés még nem garantált, a kutatás fontos első lépés ezen az úton.

Az MI tájképén végighaladva: hogyan láttatják az idegpályák a tudást?

A kutatás központi fogalma a „veszteségtáj” (loss landscape): ez a modell pontatlanságainak változását térképezi fel, ahogy milliónyi belső kapcsoló – az ún. súlyok – értéke módosul. Képzelj el egy dombos-völgyes terepet, ahol a lejtők a hibaarányt mutatják: a modellek a tanítás során mindig a lejtőn lefelé gurulnak, a hibák csökkenése felé.

A kutatók azt vizsgálták, mennyire érzékeny a teljesítmény a súlyok apró módosításaira – azaz mennyire „hegyes” vagy „sima” egy-egy irányban a táj. Egyetlen memorizált tény éles csúcsot eredményez, de ezek mind másfelé állnak, így összesítve lapossá válnak. Az érvelés – amit számos különböző kérdésnél lehet használni – inkább széles, azonos irányú dombokat képez, amelyek megmaradnak az átlagolás során is.


Minden MI másként őrzi a tudását

A tapasztalatokat több különböző rendszerrel ellenőrizték: például az Allen Institute OLMo-2 modelljeivel, amelyeknek minden súlya és tanítóadata nyilvános. Képelemző rendszereken is futottak próbákat: a kutatók direkt összekevert címkékkel tanítottak be egy 86 millió paraméteres Vision Transformert, hogy ellenőrzött módon idézzenek elő memorizálást.

Az eljárással a memorizált tartalmak szó szerinti visszaidézési aránya 3,4 százalékra esett, míg a logikus gondolkodási feladatok 95–106 százalékos szinten maradtak. Ezekben olyan tesztek szerepeltek, mint logikai kifejezések értékelése, dedukciós feladványok (például „A magasabb B-nél”), tárgyak követése cseréket követően, illetve ismerős MI-benchmarkfeladatok.

Noha a logikai gondolkodás szívós maradt, a matematikai műveletek, illetve a lexikális tudás (pl. országok fővárosai) teljesítménye jelentősen csökkent, akár harmadával–ötödével is. A modellek tehát még mindig inkább példákat memorizálnak, mintsem szabályokat alkalmaznának, például összeadáskor. A nyílt könyves (open-book) típusú kérdések, amelyek a kérdésben adott információ felhasználásán alapulnak, kevésbé sérültek.

Külön figyelmet érdemel, hogy az információ típusa is számít: a gyakori tudáselemek sérülnek a legkevésbé, a ritkák (pl. vállalatok vezérigazgatói) pedig akár 78 százalékban is kieshetnek törléskor.

A K-FAC (Kronecker-Factored Approximate Curvature) eljárás messze felülmúlta a korábbi, a memorizálást kiirtó módszereket, miközben nem volt szükség kézzel gyűjtött példákra.

Az emlékezet törlésének végső határai

Noha biztatóak az eredmények, a kutatók hangsúlyozzák: egyelőre nem lehet teljesen kiirtani a tanult tartalmakat. A törölt emlékek könnyen visszajöhetnek, ha az MI-t néhány további körben újra betanítják. A műszaki háttér egyes szélsőséges esetekben (például nagyon lapos vagy nagyon hegyes vidéken) bizonytalan adatokat szolgáltathat – szerencsére ez nem befolyásolja a törlés hatékonyságát.

Összefoglalásként megjegyezhető, hogy az MI-modellekben a memorizálás és az érvelés tényleg külön utakon fut, és ez a felfedezés jelentősen javíthatja a jövőbeli rendszerek átláthatóságát, szerkeszthetőségét és adatvédelmét.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

csütörtök 21:57

Itt a beépített videóhívás: forradalom az üzenetküldésben

📺 Az SMS világa évek óta lemaradásban van az olyan modern alkalmazásokhoz képest, mint a WhatsApp vagy az iMessage, ahol könnyedén lehet váltani szöveges üzenetküldésről hívásra, és a formázási lehetőségek is jóval szabadabbak...

csütörtök 21:46

Az MI forradalmasítja a matekot: közeleg a gépi bizonyítás kora?

🧠 Külön említést érdemel, hogy egyre közelebb kerül a tudomány ahhoz, hogy matematikai bizonyításokat gépekkel ellenőrizzenek, garantálva ezzel azok helyességét...

csütörtök 21:23

Az EU górcső alá veszi a Snapchat gyerekvédelmi hibáit

🔍 Az Európai Unió hivatalos vizsgálatot indított a Snapchat működése kapcsán, mert felmerült a gyanú, hogy a platform nem tesz eleget a kiskorúak védelméért...

csütörtök 21:15

Az Intel Core Ultra 270K és 250K Plus jók, csak minden drága

Különösen igaz ez akkor, ha új gép építésén vagy fejlesztésén gondolkodsz: ma már nem elég egy jó ár-értékű processzort találni, hiszen a memória-, SSD- és videokártya-árak miatt minden PC-alkatrész nehezen elérhető „jó vétel”...

csütörtök 20:25

Az új Wi‑Fi 7 routerekbe tényleg megéri beruházni?

Például nemrég még felesleges pénzkidobásnak tartottam a Wi‑Fi 7 routerek beszerzését: túl drágák voltak, ráadásul csupán marketingfogásnak tűntek...

csütörtök 20:12

Az északi-sarki jégolvadás újabb ijesztő csúcsot döntött

🔥 Az északi-sarki tengeri jégtakaró idén ismét történelmi mélypontra zsugorodott, miután a téli növekedési időszak végén mindössze 14,29 millió km²-re terjedt ki...

csütörtök 20:01

A Pentagon új titkos fegyvere: az Xbox-kontroller

🕹 Az amerikai hadsereg legújabb csúcstechnológiás lézerfegyverei mögött egy egészen meglepő titok rejtőzik: nem más, mint a jól ismert Xbox-kontroller...

csütörtök 19:56

Az antiprotonok megindulnak: történelmi áttörés a CERN-ben

A CERN kutatói történelmi bravúrt hajtottak végre: először sikerült teherautón szállítaniuk egy antiprotonfelhőt...

csütörtök 19:44

A kínai AI-bizniszben ragadnak a Manus vezetői, miközben a Meta kaszál

Van itt egy kis kavar a kínai AI-szcénában! A Manus nevű, mesterséges intelligenciával foglalkozó startup Kínában indult, de tavaly áthelyezte bázisát és fő csapatát Szingapúrba...

csütörtök 19:34

Az új Meta-csomag tényleg megkönnyíti a vállalkozók életét?

💼 Érdekes fejlemény, hogy a Meta nagyszabású újítással igyekszik fellendíteni a kisvállalkozói szférát, miközben a mesterséges intelligencia térnyerése meghatározza az üzleti világ jövőját...

csütörtök 19:25

Az Intercom új MI-je letarolja az ügyfélszolgálati piacot

Felmerül a kérdés, hogy egy 15 éves, alapvetően ügyfélszolgálati platform hogyan tudja megelőzni a legnagyobb MI-óriásokat – mégis pontosan ezt állítja most az Intercom...

csütörtök 17:57

A Hold rejtett árnyéka pajzsként védhet az űrsugárzás ellen

A Hold felszínén eddig ismeretlen, kozmikus sugárzástól védett „üregre” bukkantak a kínai Chang’e–4 szonda adatai alapján...

csütörtök 17:47

A Mistral MI nagy dobása: ingyen adja hanggenerátorát

🎧 Az MI-alapú hangmegoldások piaca forrong, és mindenki az aranytojást tojó tyúkot keresi a vállalati ügyfelekért vívott harcban...

csütörtök 17:34

Az iPhone-okra vadászó Coruna-kémszoftver még veszélyesebb lett

Az iOS-t futtató eszközökre leselkedő veszélyek új szintre léptek: a Coruna nevű exploitkeretrendszer a korábbi, hírhedtté vált Operation Triangulation továbbfejlesztett változata, amely már az Apple legújabb A17 és M3 processzorait, valamint az iOS 17...

csütörtök 17:24

Az online csalók új csapdái: így védekezz most

Az online csalások ma már profi váltófutásra emlékeztetnek: különböző eszközök és szereplők alkotnak egy szövevényes láncot, amelyben mindenki a saját szakaszára specializálódott...

csütörtök 17:13

A biztonság rémálma: közeleg a kvantumszámítógépek kora?

A digitális világban egyre többen tartanak attól, hogy az MI önállósodása alapjaiban forgathatja fel a társadalmat...

csütörtök 17:01

A TikTokon tarol az új csaláshullám: üzleti fiókok a célpontok

💸 TikTok Business-fiókok estek visszaélések célpontjává egy új, kifinomult adathalász-támadásban. Az elkövetők olyan hamis weboldalakra csábítják az áldozatokat, amelyeket kifejezetten azért hoztak létre, hogy a biztonsági botok ne tudják felismerni őket...

csütörtök 16:57

Az űrtávcsövet egy robot mentheti meg a pusztulástól

A NASA Neil Gehrels Swift Obszervatórium lassan végzetes pályát fut be...

csütörtök 16:45

A deepfake röntgenek még az orvosokat is megtévesztik

Érdemes megvizsgálni, hogy milyen veszélyeket rejtenek a mesterségesen generált, úgynevezett deepfake-röntgenfelvételek, amelyek megtévesztően valósághűek – olyannyira, hogy még képzett radiológusok számára is szinte lehetetlen felismerni a hamisítványokat...

csütörtök 16:34

Az agy titkos védőszelepe: áttörés a Parkinson-kutatásban

Az emberi sejtek védekezőképessége mindig is lenyűgözte a kutatókat, most pedig egy újabb titok lepleződött le, amely segíthet a Parkinson-kór leküzdésében...

csütörtök 14:04

Az Avata 360: drónforradalom, vagy csak pörgünk körbe-körbe?

🚀 A DJI legfrissebb dobása, az Avata 360 drón nemcsak a panorámadrónozás világát forgatja fel, hanem az otthoni filmezés, vlogolás és kalandvideók piacát is...

csütörtök 13:57

Az Intel Battlemage végre megérkezett, de a játékosok csalódhatnak

Az Intel hosszú várakozás után bemutatta új grafikus kártyáját, az Arc Pro B70-et, amely a régóta pletykált Big Battlemage GPU-ra épül, ám ezúttal nem a játékosokat, hanem az MI-alkalmazásokat célozza meg...

csütörtök 13:45

Az Uber robotaxijai megrohanják Horvátországot – kínai technikával

Zágráb utcáira érkezik az Uber és a kínai Pony.ai közös robotaxi-szolgáltatása, amelyet egy horvát cég, a Verne fog össze – ők gondoskodnak a teljes működési rendszer kiépítéséről...

csütörtök 13:23

Az Exynos 2800: végre tanult a hibáiból a Samsung?

Érdemes megvizsgálni, milyen változások várhatók a Samsung következő generációs mobilchipjénél. Az Exynos 2800 koncepciója mostanra körvonalazódik, és úgy tűnik, a vállalat ezúttal a stabilitást helyezi előtérbe a Galaxy S28 szériánál...

csütörtök 12:01

Az új PolyShell-támadás a Magento-áruházak felét fenyegeti

Fontos megérteni, hogy az utóbbi napokban tömeges támadássorozat indult a Magento Open Source és az Adobe Commerce rendszereket érintő, súlyos PolyShell-sebezhetőség kihasználására...

csütörtök 11:56

Az MI megeszi az adatközpontok akkumulátorait – új korszakot nyit a Panasonic

A nagy memóriagyártók már minden idei moduljukat eladták, így hiányok és áremelkedések alakultak ki a piacon...

csütörtök 11:45

Az új Razer Blade 16: karcsú, brutális és piszkosul drága

A Razer legújabb, 16 hüvelykes laptopja látványos hardverfrissítéssel érkezik: az Intel vadonatúj Core Ultra lapkáival és ultragyors, 9600 MHz-es LPDDR5X memóriával kapható, legalább 32 GB-tal szerelve...

csütörtök 11:34

Az új Galaxy A57 végre könnyebben javítható

🔧 A Samsung Galaxy A57 5G-t már a bemutató előtt, néhány órával szét is szedték, és ami a leginkább feltűnő: a telefont végre a könnyű javíthatóság jegyében tervezték...

csütörtök 11:12

A techóriások pórul jártak: kétmilliárdos bírság a közösségi oldalaknak

💸 Egy amerikai esküdtszék történelmi döntése értelmében a Meta és a YouTube összesen 6 millió dollár (közel 2,2 milliárd forint) kártérítést köteles fizetni egy ma 20 éves fiatal nőnek és édesanyjának...