2025. 08. 16., 09:02

Rugók és vonalzók segíthetnének megérteni a mesterséges intelligenciát?

Rugók és vonalzók segíthetnének megérteni a mesterséges intelligenciát?
Ahogyan a mély neurális hálózatok (DNN-ek) egyre nagyobb befolyást gyakorolnak mindennapi életünkre – gondoljunk csak a nagy nyelvi modellekre vagy az okos gépi felismerő rendszerekre –, egyre égetőbbé válik a kérdés: tulajdonképpen hogyan tanulják meg ezek a modellek azokat a fontos tulajdonságokat, amelyek lehetővé teszik számukra a pontos előrejelzést. A kutatók már régóta próbálják feltérképezni ezt a folyamatot, hiszen ebben rejlik a hatékony MI működésének kulcsa. Nem hagyható figyelmen kívül, hogy az utóbbi időben fizikai és geometriai hasonlatok segítségével próbálják megérteni a DNN-ek tanulását. Az egyik legizgalmasabb megközelítés bázeli és kínai kutatóktól származik, akik egy egyszerű, mégis szemléletes mechanikai rendszert – a rugó-blokk láncokat – alkalmaztak a mély neurális hálózatok rétegeinek elemzésére.

Fizikai analógia: rugó-blokk rendszerek és MI

Az emberi képzelet számára könnyen értelmezhetőek olyan mindennapi tárgyak, mint a hajtogatható mérővonalzó vagy a ruhafogas. A kutatók rájöttek, hogy ezek a hétköznapi eszközök szinte pontosan leírják, ahogyan a mély neurális hálózatok egyre jobban elkülönítik az adatokat a rétegeikben. A rugó feszülése megfeleltethető annak, mennyire egyszerűsíti, választja szét egy réteg az adatokat, míg a súrlódás a hálózat nelinearitását reprezentálja. Ha ehhez még egy kis „zajt” is hozzáadunk – például edzési zaj vagy vibráció –, az még tovább árnyalja a tanulási folyamatot.

Ráadásul, amint nő a rendszerben a nelinearitás, a felsőbb (mélyebb) rétegek jóval nagyobb változást, szeparációt hoznak létre az adatokon, míg az alsóbbak kevésbé. Mindazonáltal, ha zaj kerül a rendszerbe, vagy a rugóblokkok remegnek, ezek az eltérések kiegyenlítődnek, és az adat-szeparáció kiegyenlítettebb lesz minden rétegben. Ebből következően a megfelelő súrlódás, rugóerő és zaj kombinációja optimalizálhatja a tanulási folyamatot, így a neurális hálózatok gyorsabban és pontosabban tanulnak.

Miért különleges ez az elmélet?

Nem elhanyagolható, hogy a legtöbb eddigi kutatás túlzottan leegyszerűsített modellekkel dolgozott, amelyek nem tudták együtt vizsgálni a valóban fontos tényezőket, mint a mélység, a nelinearitás, a zaj, a tanulási ráta vagy az adatok normalizálása. A mostani megközelítés – bár nem első elvekből indul ki – mégis képes a fenti összetevők együttes hatását vizsgálni, és valódi, összetett DNN-ekre is alkalmazható.

A rugó-blokk modell segítségével a kutatók ki tudták számítani a tanulás során fellépő adat-szeparáció görbéjét is, illetve könnyen meg lehet jósolni, hogy ez a görbe mikor mutat túltanulást vagy redundanciát egyes rétegekben. Ez különösen fontos, mivel egy ilyen görbe olcsón számolható, mégis megbízhatóan előrejelezheti, hogyan fog egy hálózat teljesíteni új, eddig nem látott adatokon. Potenciálisan akár a nagy nyelvi modellek (LLM-ek) gyorsabb és hatékonyabb tanítását is lehetővé teszi – és erre már nagy szükség van, hiszen egy modern, transformer-alapú MI modell tanítása dollármilliókba (több milliárd forintba) kerülhet.

Hétköznapi tárgyak, bonyolult MI rendszerek

A kutatók szinte játékos kedvvel vetették bele magukat a háztartási tárgyak tanulmányozásába: képeket és videókat cseréltek hajtogatható vonalzókról, kitámasztható edényalátétekről, sőt még azt is lemodellezték, hogy egyes világhíres MI hálózatok (például a Maradék Háló – ResNet) vajon melyik eszközzel írhatók le legjobban. Így született meg az az ötlet, hogy a rugó-blokk lánc nem csupán földrengések vagy anyagdeformációk leírására, hanem MI-alapú tanulás modellezésére is kiváló lehet.

Ahogy egy rugó-blokk láncban a rugók húzóereje fokozatosan kiegyenlítődik minden szakaszon, úgy egy jól tanított DNN is képes minden rétegében közel azonos mértékben szétválasztani az adatokat, feltéve, hogy a megfelelő paramétereket állítjuk be.


A jövő: diagnosztika, optimalizáció

A rugó-blokk modell nem csak elméleti bravúr. Könnyen elképzelhető, hogy hamarosan diagnosztikai eszközök készülnek majd a segítségével MI-fejlesztők számára. Ugyanúgy, ahogy a szerkezetmechanikában a feszültségtérképek kijelölik a gyenge pontokat, a neurális hálózatok rétegeiben is felismerhetővé válnak a túlterhelt vagy kihasználatlan régiók. Ez kulcsfontosságú például a túltanulás elkerülésében vagy éppen a felesleges, redundáns rétegek kiszűrésében, ezzel időt, energiát és pénzt is spórolva.

Nem hagyható figyelmen kívül, hogy az embereknek ösztönösen van elképzelésük arról, hogyan működnek a rugók és blokkok – ellentétben a milliárd paraméteres MI modellekkel. Ebből következően a jól érthető fizikai analógiák alkalmazása nem csupán szemléletesebbé teszi az MI-kutatást, hanem konkrét, a gyakorlatban is jól használható eredményekhez vezet.

2025, adminboss, phys.org alapján

Legfrissebb posztok

MA 17:02

A Rhythm Heaven Groove fél ütemmel kullog a vetélytársak mögött

Ha valaki több mint egy évtizede játszott a Rhythm Heavennel, valószínűleg sosem felejtette el azt a különös, szürreális világot, ahol dadogó pankrátorok és furcsa madarak ugrálnak egy lélekmelengető popdallamra...

MA 16:31

Az antwerpeni társasháztűzben legalább hatan meghaltak

🔥 Legalább hatan életüket vesztették, amikor tűz ütött ki egy tízemeletes társasházban Antwerpen Linkeroever városrészében...

MA 16:01

A brit üvegszálfronton új csavar: gyorsítottan kebeleznék be a Netomniát

A brit távközlési piac gigantikus átalakulása zajlik: az ország versenyhatósága kiemelt vizsgálatot indított annak kapcsán, hogy a Netomnia anyavállalatát, a Substantialt a Liberty Global, a Telefonica és az InfraVia konzorciuma felvásárolja...

MA 15:31

Az étteremláncok titkos háborúja az új márkák bekebelezéséért

Egy márka felvásárlása mindig izgalmas hír, de az igazi próbatétel csak akkor kezdődik, amikor a háttérben elindul a két vállalkozás összefésülése...

MA 15:01

A Meta limitet szab az okosszemüvegek Conversation Focusának

👑 A Meta okosszemüvegei új korlátozást kaptak: már csak havi három órán át használható ingyen a Conversation Focus nevű funkció...

MA 14:31

Az amerikai kormány újra zöld utat ad Anthropic Mythos és Fable MI‑modelljeinek

Az Egyesült Államok Kereskedelmi Minisztériuma feloldotta az exporttilalmat az Anthropic két fejlett MI-modellje, a Mythos 5 és a Fable 5 esetében...

MA 10:25

Az amerikai kormány zöld utat ad a legerősebb Claude-oknak

Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...

MA 10:01

A Meta-leépítések után is cáfolja az MI miatti állásfélelmeket Zuckerberg

A technológiai iparban egyre nagyobb félelem övezi azt, hogy az MI széles körű elterjedése mennyi munkahely megszűnéséhez vezethet...

MA 09:25

A rejtélyesen eltűnő chatek: felháborodtak a Claude Code-felhasználók

Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...

MA 09:14

A Pokémon GO júliusa: új raidfőnökök, kiemelt órák, GO Fest-őrület

Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 7/1

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...

MA 09:01

Az MI rejtett szívkockázati jelre bukkant a százéves EKG-ban

❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...

MA 08:37

A NASA négy új robotküldetéssel tör utat a holdbázisnak

🚀 Megemlíthető, hogy az amerikai űrügynökség egyre nagyobb lendülettel dolgozik azon, hogy hosszú távú emberi jelenlétet teremtsen a Holdon...

MA 08:25

Az MI-lökéshullám felpörgeti a Dell bevételeit, de messze nem aranybánya

Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...

MA 08:13

A 6 milliós Pokémon-kártyalopásért több mint tíz év börtönt kapott

💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...

MA 08:01

A Szamóca-hold ma este: az év legalacsonyabb, apró teliholdja

🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...

MA 07:48

Az Android 17 új zárképernyő-trükkje bárkit elbuktat betöréskor

Az Android 17 jelentős szigorításokat vezet be a zárolóképernyőn, amellyel gyakorlatilag ellehetetleníti a PIN vagy jelszó feltörését...

MA 07:36

A kínai Lineshine szuperszámítógép világrekorder: közel 2 kvadrillió művelet/mp

A kínai LineShine szuperszámítógép most először szerezte meg a világelsőséget a számítási sebesség terén...

MA 07:25

Az amerikai agrárminisztérium 180 millió legyet enged szabadon – íme, miért

A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...

MA 07:13

A Microsoft felpörgeti kvantumbiztos ütemtervét, nőnek a kockázatok

⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...

MA 06:49

Az MI‑böngészők új réme: a BioShocking-adatlopás

Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...

MA 06:37

A Samsung szó szerint átformálja a hajlítható telefonjait?

Ahogy beköszönt a nyár, egyre hangosabbak a pletykák a Samsung legújabb összehajtható telefonjairól...

MA 06:06

Történelmi események a mai napon (Július 1.)

Ma háborúk fordulópontjai, birodalmak átrendeződései és új korszakokat nyitó tudományos, társadalmi mérföldkövek találkoznak...

MA 06:01

Az okosabb botvédelem mostantól megóvja a Teams-megbeszéléseket

🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...

kedd 18:32

A Cleveland-i Fed elnöke szerint MI fűti az inflációt – jöhet újabb kamatemelés

A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...

kedd 18:01

A Samsung Messages júliusban leáll: ezt az 5 dolgot tedd meg azonnal!

⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...

kedd 17:02

Az új CRISPR az epigenomot célozza, átírja a gének kapcsolóit

🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..

kedd 16:31

A Tata Electronicsnál múlt héten kiszivárogtak érzékeny iPhone-beszállítói adatok

Az elmúlt héten hatalmas adatlopás történt az indiai Tata Electronicsnál, ahol közel 630 GB-nyi bizalmas információ került illetéktelen kezekbe...

kedd 16:01

A YouTube-on már nézhető a Peacock – épp a vb-re!

A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...