2025. 11. 11., 10:58

Az MI agyában a memorizálás és a gondolkodás másként működik

Az MI agyában a memorizálás és a gondolkodás másként működik
Amikor a mérnökök hatalmas nyelvi modelleket, például a GPT-5-öt fejlesztenek, két látványosan eltérő képesség bukkan fel: a memorizálás, vagyis a már látott szövegek pontos visszamondása – ilyenek például idézetek vagy regényrészletek –, és az érvelés, azaz amikor a modell új helyzetekben próbál elvont összefüggések alapján megoldani problémákat. Egy mostani kutatás először mutatta ki, hogy ez a két funkció ténylegesen eltérő neurális útvonalakon valósul meg a modell szerkezetében. Külön figyelmet érdemel, hogy a szétválasztás meglepően tisztán sikerült. A kutatók manipulálták a modelleket: amikor kiszedték a memorizálásért felelős idegpályákat, a modellek 97 százalékkal gyengébben idézték vissza a tanítóadatokat, de a logikus gondolkodási képességeik szinte változatlanul megmaradtak.

Az MI és a számolás: memorizált tény vagy logikus művelet?

A nyelvi modellek – némileg meglepő módon – nehezen teljesítenek matematikai feladatokat, ha nem használnak külső segédeszközt. Inkább visszamondják a megtanult számtáblákat, ahelyett hogy ténylegesen kiszámítanák az eredményt, mint például egy tanuló, aki csak magolja a szorzótáblát. Ez arra utal, hogy a mostani modellek számára a 2+2=4 inkább memorizált tény, mint egy elemi matematikai összefüggés.

Noha az MI-kutatók által használt „érvelés” fogalma nem pontosan egyezik azzal, amit emberi gondolkodás alatt értünk, a mostani vizsgálatban épségben maradt gondolkodási képességek közé tartozik például az igaz–hamis állítások vizsgálata vagy a „ha–akkor” típusú szabályok követése. Ezek nem igényelnek valódi kreativitást vagy elmélyült problémamegoldást, inkább korábban megtanult sémák felismeréséről szólnak, míg az elvontabb, matematikai következtetés ma még kívül esik e modellek lehetőségein.

Adatkitörlés: potenciális védelem a jövő MI-jeiben?

A módszer jövőbeli továbbfejlesztése akár lehetővé teheti, hogy a fejlesztők szelektíven távolítsanak el szerzői jogi védelem alatt álló vagy érzékeny adatokat egy MI-ből anélkül, hogy az elveszítené további hasznos funkcióit. Noha a neurális hálókban az információ elosztott módon, sokszor bonyolultan tárolódik, és jelenleg a teljes törlés még nem garantált, a kutatás fontos első lépés ezen az úton.

Az MI tájképén végighaladva: hogyan láttatják az idegpályák a tudást?

A kutatás központi fogalma a „veszteségtáj” (loss landscape): ez a modell pontatlanságainak változását térképezi fel, ahogy milliónyi belső kapcsoló – az ún. súlyok – értéke módosul. Képzelj el egy dombos-völgyes terepet, ahol a lejtők a hibaarányt mutatják: a modellek a tanítás során mindig a lejtőn lefelé gurulnak, a hibák csökkenése felé.

A kutatók azt vizsgálták, mennyire érzékeny a teljesítmény a súlyok apró módosításaira – azaz mennyire „hegyes” vagy „sima” egy-egy irányban a táj. Egyetlen memorizált tény éles csúcsot eredményez, de ezek mind másfelé állnak, így összesítve lapossá válnak. Az érvelés – amit számos különböző kérdésnél lehet használni – inkább széles, azonos irányú dombokat képez, amelyek megmaradnak az átlagolás során is.


Minden MI másként őrzi a tudását

A tapasztalatokat több különböző rendszerrel ellenőrizték: például az Allen Institute OLMo-2 modelljeivel, amelyeknek minden súlya és tanítóadata nyilvános. Képelemző rendszereken is futottak próbákat: a kutatók direkt összekevert címkékkel tanítottak be egy 86 millió paraméteres Vision Transformert, hogy ellenőrzött módon idézzenek elő memorizálást.

Az eljárással a memorizált tartalmak szó szerinti visszaidézési aránya 3,4 százalékra esett, míg a logikus gondolkodási feladatok 95–106 százalékos szinten maradtak. Ezekben olyan tesztek szerepeltek, mint logikai kifejezések értékelése, dedukciós feladványok (például „A magasabb B-nél”), tárgyak követése cseréket követően, illetve ismerős MI-benchmarkfeladatok.

Noha a logikai gondolkodás szívós maradt, a matematikai műveletek, illetve a lexikális tudás (pl. országok fővárosai) teljesítménye jelentősen csökkent, akár harmadával–ötödével is. A modellek tehát még mindig inkább példákat memorizálnak, mintsem szabályokat alkalmaznának, például összeadáskor. A nyílt könyves (open-book) típusú kérdések, amelyek a kérdésben adott információ felhasználásán alapulnak, kevésbé sérültek.

Külön figyelmet érdemel, hogy az információ típusa is számít: a gyakori tudáselemek sérülnek a legkevésbé, a ritkák (pl. vállalatok vezérigazgatói) pedig akár 78 százalékban is kieshetnek törléskor.

A K-FAC (Kronecker-Factored Approximate Curvature) eljárás messze felülmúlta a korábbi, a memorizálást kiirtó módszereket, miközben nem volt szükség kézzel gyűjtött példákra.

Az emlékezet törlésének végső határai

Noha biztatóak az eredmények, a kutatók hangsúlyozzák: egyelőre nem lehet teljesen kiirtani a tanult tartalmakat. A törölt emlékek könnyen visszajöhetnek, ha az MI-t néhány további körben újra betanítják. A műszaki háttér egyes szélsőséges esetekben (például nagyon lapos vagy nagyon hegyes vidéken) bizonytalan adatokat szolgáltathat – szerencsére ez nem befolyásolja a törlés hatékonyságát.

Összefoglalásként megjegyezhető, hogy az MI-modellekben a memorizálás és az érvelés tényleg külön utakon fut, és ez a felfedezés jelentősen javíthatja a jövőbeli rendszerek átláthatóságát, szerkeszthetőségét és adatvédelmét.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Lively Letters – Phonics (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ImgRef (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) ContactVault Pro (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) FormatX: Video Audio Converter...

APP
péntek 09:11

APPok, Amik Ingyenesek MA, 6/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     FormatX: Video Audio Converter (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) War Mongrels (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Monthly Dystopia...

APP
csütörtök 09:11

APPok, Amik Ingyenesek MA, 6/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp:...

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...