MA 07:37

Az MI új korszaka: a ZAYA1-8B, a takarékos áttörés

Az MI új korszaka: a ZAYA1-8B, a takarékos áttörés
Ebből következően érdemes megérteni, hogy a mesterséges intelligencia világában az óriási, egyre nagyobb modellek mellett egyre nagyobb figyelmet kapnak azok a fejlesztések, amelyek a kisebb, hatékonyabb és széles körben elérhető megoldásokra építenek. A legújabb ilyen modell egy Palo Altó-i startup, a Zyphra fejlesztése: a ZAYA1-8B, amely mindössze 8,4 milliárd paraméterből áll, ám ebből egyszerre csak 760 millió aktív, miközben teljesítményében felveszi a versenyt olyan óriásokkal, mint a GPT-5-High vagy a DeepSeek-V3.2. Jelentősége abban rejlik, hogy kizárólag AMD Instinct MI300 GPU-kon képezték, ezzel komoly konkurenciát állítva az Nvidia dominanciájának az MI-fejlesztés területén. A ZAYA1-8B nyílt forráskódú, kifejezetten rugalmas Apache 2.0 licenc alatt szabadon alakítható, átalakítható és akár kereskedelmi célokra is felhasználható.

Miben különleges a ZAYA1-8B?

A Zyphra ZAYA1-8B fejlesztését a “teljes stack-innováció” filozófiája határozza meg. A modell alapját a vállalat saját, MoE++ (Mixture of Experts Plus Plus) architektúrája adja, amely három jelentős újítást kínál a klasszikus Transformer-modellekhez képest:

Az első a Compressed Convolutional Attention (CCA), amely a kontextusablakok bővülésével is képes megtartani a memóriatakarékosságot; akár nyolcszoros csökkenést is elér a KV-cache méretében, leegyszerűsítve a hosszú gondolatsorok kezelését.

A második újítás a ZAYA1 MLP Router: míg a legtöbb Mixture of Experts modell lineáris routerrel működik, itt egy több rétegből álló MLP-dizájn dönt a megfelelő szakértőkről, ehhez pedig stabilitást ad egy klasszikus, szabályozáselméleti ihletésű bias-kiegyenlítő rendszer.

A harmadik újdonság a Learned Residual Scaling, amely irányítja az információáramlás mélységét a 40 rétegen keresztül, megelőzve a gradiens-eltűnést és -robbanást minimális számítási költséggel.

Újszerű gondolkodás – már a betanításon belül

A ZAYA1-8B-nél már az előtanítás során hangsúlyt kapott a logikai következtetés. A hosszú láncolt gondolkodást (“chain-of-thought”, CoT) egy ún. Answer-Preserving (AP) Trimming technikával sikerült megtartani: a túl hosszú problémamegoldó gondolatmenetek közepét kivágják, de a felvezetést és a megoldást meghagyják, így a modell a problémák és a válaszok viszonyát memóriakorlátok mellett is képes megtanulni.

Az igazi áttörést azonban a Markovian RSA eljárás jelenti. Ez a módszer lehetővé teszi a “mélyebb gondolkodást” anélkül, hogy a modell elveszne a zajos, túl hosszú kontextusokban. Több, párhuzamos következtetési szálat generál, majd ezek végeit összegzi, így a ZAYA1-8B szinte végtelen idejű gondolkodásra képes – akár 4 ezer tokennyi “tartalékból” is, miközben nem pazarolja el az erőforrásokat.

Valós teljesítmény: kicsi, de rendkívül erős

A modell kivételesen jó eredményeket ért el harmadik felek által szervezett teszteken, például az AIME ’25 matematikai próbán 91,9%-os pontszámmal majdnem utoléri a lényegesen nagyobb rendszereket. Programozási és logikai feladatokban is kiemelkedő: a LiveCodeBench-en 69,2%-kal magabiztosan veri például a DeepSeek-R1-0528-at, és matematikai teszteken is túlteljesít más modelleket.

Az apró paraméterszám lehetővé teszi, hogy helyben, akár mobileszközökön vagy helyi szervereken is alkalmazható legyen, amivel cégek költséget és adatbiztonsági kockázatot is csökkenthetnek, nem beszélve a kisebb késleltetésről.

Hátránya viszont, hogy a “tudásalapú” – például lexikális adatkinyerést igénylő – feladatokban még elmarad a hatalmas modellektől, jelezve, hogy az effajta tudás tárolására még mindig jól jönnek a nagyobb, bővebb paraméterkészletek.


Nyílt forráskód és rugalmas licencelés

A ZAYA1-8B-t az Apache 2.0 licenc révén szinte bárki tetszőleges célra alkalmazhatja, akár zárt szoftverekhez is. A licenc explicit módon biztosít szabadalmi védelmet is, így a vállalkozások jogbiztonságban fejleszthetnek rá. Az új modell speciális futtatókörnyezetet igényel: a Zyphra által adaptált vllm és transformers könyvtárakban található zaya1 ágat kell használni, valamint külön kapcsolók kellenek a reasoning parser és a tool calling kezeléséhez. Több-GPU-s környezetben az adatok és a szakértők párhuzamosítása (DP + EP) ajánlott, mivel a CCA mechanizmus miatt a klasszikus Tensor Parallelism jelenleg nem támogatott.

Zyphra – tudományos háttér, nagy szándékok

A 2021-ben alapított Zyphra célja, hogy a “decentralizált”, logikai sűrűségre optimalizált általános mesterséges intelligenciát fejlessze. A társaság törekvése, hogy minél több logikai képességet szorítson egy minél kisebb paraméterkészletbe, ezzel lehetővé téve, hogy akár tableten, céges szerveren vagy okosszemüvegen is futtatható MI álljon rendelkezésre.

A vezető tudós, Beren Millidge kutatásai – például az aktív következtetés és a szabadenergia-elv területén – közvetlen hatással voltak a ZAYA1-8B és elődeinek architektúrájára, különös hangsúlyt adva az idegtudományi inspirációnak.

A Zyphra jelentős eredményeket ért el AMD hardverekre támaszkodva, sőt, a cég 2025 júniusában már „unikornis” státuszt ért el, miután 110 millió dollárnyi (majdnem 40 milliárd forint) tőkét szerzett, többek között az AMD, az IBM, a Bison Ventures és a BC VC támogatásával. A csapat 2026-ban már több mint harminc tagú.

Mit szól ehhez a szakma?

A ZAYA1-8B bejelentése villámgyorsan elterjedt az MI-fejlesztők körében, 24 óra alatt közel egymillióan látták a hírt a Twitteren. Különösen az AMD platform életképessége és a gondolkodási “kaszkád” hatékonysága keltett élénk érdeklődést. Innovációnak számít például a négylépcsős RL-kaszkád (RL-cascade) utótanítás és a Router-visszajátszás (Router Replay), amely stabilabbá és kiszámíthatóbbá teszi az adatáramlást és a szakértők kiválasztását.

Ebből adódóan nemcsak az egyre nagyobb modellek irányába vezet az út: a ZAYA1-8B bebizonyította, hogy okosabb, leleményesebb algoritmusokkal kisebb eszközökön is elérhető a csúcsteljesítmény, új korszakot nyitva a mesterséges intelligencia világában.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 09:16

A NASA Curiosityja robotkarján ragadt marsi kővel egy hétig küzdött

Tipikus eset, amikor egy látszólag egyszerű feladat váratlanul komoly akadállyá válik: a NASA Curiosity marsjárója egy egész héten át küzdött, hogy megszabaduljon egy makacs kőtől, amely a robotkar végére szorult...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/8

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Voxaro (iPhone/iPad)A Voxaro egy innovatív alkalmazás, amely valós időben alakítja át a beszédet jól szerkesztett, tiszta szöveggé...

MA 09:08

Az MI-ügynökök megoldhatják a kripto felhasználói gondjait?

💻 A kriptovilágban régóta visszatérő probléma, hogy a digitális pénztárcák és a stabilcoinok használata sokak számára még mindig nehézkes, és csak kevesen találták meg bennük a mindennapi pénzügyi élet valódi értelmét...

MA 09:02

Az univerzális Apple Watch-kábel, amit felesleges kütyünek hittem, utazáskor nélkülözhetetlen

🚀 A hosszú évek alatt megszokott útitársaim közé tartoznak a különböző töltők és kábelek, hiszen repülős üzleti utakra vagy akár néhány órás autózásokra mindig vinnem kell minden eszközöm töltőjét...

MA 08:57

Az újabb amerikai–iráni feszültség padlóra küldte a Bitcoint

💸 A kriptovaluták piacán ismét erős hullámzás tapasztalható: a Bitcoin árfolyama gyorsan visszaesett a 29,5 millió forint (79 000 dollár) körüli szintre, miután az Egyesült Államok csapást mért iráni célpontokra...

MA 08:50

Az ausztrálok hajnali háromkor csaphatnak le a Steam Controllerre

Erre utal például az, hogy az új Steam Controller pillanatok alatt elfogyott Ausztráliában, a keddi megjelenését követően...

MA 08:36

A következő stabilcoin-boomot a nagyvállalatok és az MI-ügynökök vezetik

🥇 A stabilcoinok világa teljesen új korszakba lép: multinacionális cégek egyre szélesebb körben használják határokon átnyúló pénzmozgásokhoz, miközben a mesterséges intelligenciával működő ügynökök is önálló kifizetéseket hajtanak végre a blokkláncon...

MA 08:29

A Kobo új, bohókás tokjai gyönyörűek, de hol az új hardver?

A 2026-os New York-i BookCon rendezvényen mutatta be a Kobo legújabb limitált szériás tokjait, amelyek színes és játékos dizájnnal hívják fel magukra a figyelmet...

MA 08:08

A Sakana 7B-je vezényli a GPT-5-öt, Claude-ot és Geminit

💻 A Sakana AI kutatói áttörő megközelítéssel új alapokra helyezték az MI-modellek együttműködését...

MA 08:02

Az új MI három évvel előbb azonosítja a hasnyálmirigyrákot, mint az orvosok

🧠 Fontos kérdés, hogy a hasnyálmirigyrákot mikor sikerül felfedezni, hiszen ez életet menthet...

MA 07:57

Az amerikaiaknak globális kriptólikviditást hozna a Binance.US újjáélesztése

💰 Fontos kérdés, hogy mikor férhetnek hozzá ismét az amerikai felhasználók a globális kriptovaluta-piac legjobb áraihoz...

MA 07:43

Az on-chain adatvédelem és elszámoltathatóság kéz a kézben járhatnak

🔑 A blokklánc-technológia világa egyszerre kínál teljes átláthatóságot és kihívásokat a felhasználói magánélet területén...

MA 07:28

A brazil fa lehet a COVID–19 elleni új csodafegyver

🌱 brazil kutatók egy őshonos fa leveléből származó természetes vegyületeket azonosítottak, amelyek több fronton támadják a COVID–19-et okozó vírust...

MA 07:22

A bíróságon csap össze Taylor Swift és a vegasi showgirl

💪 Taylor Swift újra bíróság előtt találja magát, ezúttal egy Las Vegas-i revütáncosnő miatt, aki azt állítja, hogy az énekesnő ellopta az Egy showgirl vallomásai (Confessions of a Showgirl) márkát...

MA 07:01

Az önvezető teherautó, amely sofőr és fülke nélkül megdöbbentette a fuvarozóipart

Egy kaliforniai start-up, a Humble Robotics mutatta be a Humble Haulert, amely minden eddigi elképzelést felülmúl azzal, hogy teljesen vezetőfülke nélkül képes szállítani árut...

MA 06:57

Az abszurd GameStop–eBay történet: a vezért eBay-ezésért tiltották ki, majd visszaengedték

A GameStop vezérigazgatója, Ryan Cohen egészen szokatlan fordulatokat produkált, amikor eBay-felvásárlási tervei kapcsán bizarr akcióba kezdett: játékosokat célzó relikviákat és sportritkaságokat kezdett el árulni az eBay-en – állítólag azért, hogy finanszírozza magát a felvásárlást...

MA 06:50

A Coinbax 20 ezer dollárt kaszált a Consensus Miami PitchFesten stablecoin-megfelelésért

A Consensus Miami konferencián a Coinbax zsebelte be a 7,2 millió forintos fődíjat, miután bemutatta azt a szoftvert, amely jelentősen egyszerűsítheti a stabilcoin-tranzakciók megfelelőségi ellenőrzését...

MA 06:43

A kriptolassulás odacsap: elmaradt Q1 után 5%-ot zuhan a Coinbase

A friss pénzügyi jelentés komoly csalódást okozott a befektetőknek: a Coinbase váratlan veszteséget szenvedett el az első negyedévben, és elmaradt a bevételi várakozásoktól is...

MA 06:36

Miért nem forog a Webb által felfedezett óriásgalaxis?

A James Webb-űrtávcső friss megfigyelései minden előzetes várakozást felülírnak: a távoli XMM-VID1-2075 galaxis a világegyetem kezdeti korszakából származik, ám egészen meglepő módon nem mutat semmiféle forgásra utaló nyomot...

MA 06:30

Az Anthropic újítása: álmodó MI-ügynökök, akik hibáikból tanulnak

San Franciscóban zajló második Anthropic-konferencián látványos eredményekkel mutatkozott be a Claude platform legnagyszabásúbb frissítése, amelynek középpontjában egy új, „álmodás” (dreaming) nevű fejlesztés áll...

MA 06:22

A lehetetlen bolygópár, amely mégis létezik

A Tejútrendszer egyik távoli pontján, mintegy 190 fényévre a Földtől, kutatók egy különleges bolygópárosra bukkantak...

MA 06:06

Történelmi események a mai napon (Május 8.)

Ma olyan nap, amikor fordult a történelem kereke: Jeanne d’Arc áttörte Orléans ostromát, véget ért az európai háborúskodás a V-E Day napján, és az Egészségügyi Világszervezet megerősítette a himlő felszámolását...

csütörtök 21:58

A Forza Horizon 6 eddig megerősített autófelhozatala – íme!

🚗 Idén ősszel minden eddiginél nagyobb durranásnak ígérkezik a Forza Horizon 6, amelyben ezúttal Japán vadregényes vidékein, városaiban, hegyeiben és tengerpartjain száguldozhatunk, méghozzá a valaha volt legnagyobb választékkal...

csütörtök 21:46

A Yakuza-sorozat eredettörténete: ilyen lesz a Stranger Than Heaven

🗿 Az RGG Studio legújabb játéka, a Különösebb a mennyországnál (Stranger Than Heaven) a 20...

csütörtök 21:34

A kontextus nélkül könnyen összeomlik az MI – így orvosolható

Ilyen eset például, amikor a vállalat abban reménykedik, hogy a legmodernebb MI-modell végre áttörést hoz: precíz, személyre szabott eredményeket vár tőle – de ehelyett egységes, sablonos vagy akár teljesen irreleváns válaszokat kap...

csütörtök 21:01

Az XRP 1,42 dollár alá csúszott: kitörést lesnek a kereskedők

Miután több napon át próbált 1,45 USD (kb. 535 HUF) felett maradni, az XRP elbukott, és hirtelen, 25%-os visszaeséssel 1,42 USD (kb...

csütörtök 20:57

Az iráni hekkerek zsarolóvírus-kampánnyal adatokat lopnak a Microsoft Teamsen

Érdekes fejlemény, hogy államilag támogatott iráni hekkerek egyre kifinomultabb módszerekkel támadnak, és közben mindent megtesznek azért, hogy álcázzák valódi szándékaikat...

csütörtök 20:46

Az Anthropic szkennerei mindent átengedtek: a kártékony kód tesztfájllal jutott be

⚠ Hétköznapi helyzet fejlesztőknél: fut egy Anthropic Skill-szkenner, amely átvizsgálja a ClawHubról vagy a skills...

csütörtök 20:23

A 700 millió dolláros migráció: a Solv Protocol Chainlinkre vált LayerZeróról

Erre utal többek között az, hogy a Solv Protocol több mint 700 millió dollár, vagyis mintegy 255 milliárd forint értékű tokenizált bitcoint (SolvBTC, xSolvBTC) visz át a Chainlink CCIP-jére, miután komoly biztonsági problémák merültek fel a LayerZero hídjával kapcsolatban...