MA 07:17

Itt a Gemma 4: végre egy valóban nyílt Google-modell

Itt a Gemma 4: végre egy valóban nyílt Google-modell
A Google alaposan felforgatta az MI-modellek piacát: a Gemma 4 család immár Apache 2.0 licenc alatt szabadon használható, így megszűntek a korábbi, bonyolult jogi megkötések. Ez a döntés nemcsak technológiai, hanem jogi szempontból is mérföldkő, mivel a Gemma eddig a saját engedélyével nehezítette a széles körű vállalati adaptációt. Most viszont valódi nyílt forrású alternatívát kínál, amely teljes mértékben versenybe száll a Mistral, az Alibaba Qwen vagy az Arcee mellett – anélkül, hogy le kellene ülni a jogi osztállyal konzultálni minden egyes felhasználás előtt.

Négy modell, két kategória: a felhőtől a mobilig

A Gemma 4 két fő vonalat képvisel négy modellel. A „workstation” csoportban egy 31 milliárd paraméteres sűrű modell és egy 26 milliárd paraméteres, aktív szakértőkkel dolgozó „Mixture-of-Experts” építésű modell található. Mindkettő támogatja a szöveg- és képbemenetet, sőt, 256 ezer tokenes kontextusablakot is kezel. Az „edge” irányban két kisebb változat, az E2B és E4B érhető el, amelyeket okostelefonokra, beágyazott eszközökre és laptopokra optimalizáltak, és támogatják a szöveg-, kép- és hangfeldolgozást is, 128 ezer tokenig.

A modellek neveiben az „E” az „effective parameters”-t jelzi: például az E2B ténylegesen 2,3 milliárd paramétert mozgat, bár összességében 5,1 milliárd paramétere van, mivel minden dekóderréteg saját beágyazási táblával dolgozik a Google saját fejlesztésű Per-Layer Embeddings technológiájával. Ez a megoldás a lemezen sok helyet foglal, de futásidőben kevés erőforrást igényel.

Az „A” betű a 26B A4B modellben „active parameters”-t jelent: a 25,2 milliárd összparaméterből egyszerre csak 3,8 milliárd dolgozik, így a modell számítási igénye egy 4B kategóriás modellhez mérhető, miközben a tudása közelít a 26B szinthez.

Külön figyelmet érdemel, hogy a MoE-architektúrával spórolhatunk

A 26B A4B modell különleges felépítésének köszönhetően a futtatás költségei drasztikusan csökkenthetők. Míg más nagy MoE-modellek néhány hatalmas szakértőt alkalmaznak, a Gemma 128 kicsi szakértőt, amelyek közül tokenenként 8-at (plusz egy univerzálisan aktív szakértőt) használ. Ez lehetővé teszi, hogy a 26B méretű modellekhez mérhető teljesítményt érjünk el, de a számításigénye egy 4B modellével egyezik meg.

Ugyanígy mindkét workstation-modell hibrid figyelmet alkalmaz: a helyi, csúszóablakos figyelmet ötvözi a teljes globális figyelemmel, ahol az utolsó réteg mindig globális. Így érhető el a 256 ezres kontextusablak, miközben a memóriahasználat kordában marad – ez kulcsfontosságú a hosszú dokumentumok, kódok vagy többlépcsős ügynökbeszélgetések feldolgozásánál.

Multimodalitás az alapoktól: látás, hang és funkcióhívás natívan

A korábbi nyílt modellekben a multimodalitás mindig utólagos toldozás-foldozás volt. Az új Gemma 4 viszont már az architektúra szintjén natív módon kezeli a látást, a hangot és a funkcióhívásokat.

A négy modell mindegyike támogatja a változó képarányú vizuális inputot, rugalmas vizuális tokenköltségvetéssel (70–1 120 token képenként). Ezzel szemben a Gemma 3 még nehézkesen boldogult OCR-rel és dokumentumértelmezéssel. Most alacsony tokenkeret mellett egyszerű címkézés és képaláírás, magasabb keretnél dokumentumszkennelés, OCR vagy részletes képelemzés is lehetséges. Natívan kezeli a többképes és videóbemenetet, így egyszerre több dokumentum vagy képernyőkép összefüggéseit is értelmezheti a modell.

Az edge modellek önálló hangfeldolgozással is bírnak: automatikus beszédfelismerés és beszédfordítás valósul meg az eszközön, a hangkódoló méretét 681 millióról 305 millió paraméterre csökkentették, a frameidő 160 ms-ról 40 ms-ra rövidült, így gyorsabb az átírás. Az egészségügyben, helyszíni munkavégzés során vagy többnyelvű ügyfélszolgálaton így minden helyben, egyetlen modellen futhat.

Minden modell natívan tud funkciókat hívni, vagyis külső eszközökkel, API-kkal strukturáltan tud együttműködni több lépésen át. Ennek köszönhetően kevesebb promptmérnöki munkára van szükség, üzleti szinten lényegesen egyszerűbbé válik egyedi MI-alapú ügynökök létrehozása.


Meggyőző benchmarkok és valódi előrelépés

A Gemma 4 mérései látványosan jobbak az előző generáció eredményeinél. A 31B-es sűrű modell 89,2%-ot ért el AIME 2026 matematikai teszten, 80%-ot a LiveCodeBench V6-on, Codeforces Elo-n 2 150 pontot hozott – régen ez csak zárt modellektől volt elvárható. Látásban a MMMU Pro 76,9%, a MATH-Vision 85,6% eredményre képes.

A 26B MoE A4B modell csak hajszállal marad el: AIME-on 88,3%, LiveCodeBench-en 77,1%, a GPQA Diamond tudományos teszten 82,3%. Az edge modellek az E4B-vel 42,5% (AIME) és 52% (LiveCodeBench), az E2B-vel 37,5% és 44% pontot szereztek – mindezt mindössze egy T4 GPU-n vagy kisebb eszközökön.

Fontos, hogy a Gemma 4 nemcsak egyetlen mutatóban jó: kombinálja az erős érvelést, a szöveg-, kép- és hangterületen natív multimodalitást, a funkcióhívást, a 256 ezer tokenes kontextust és a szabad felhasználást – mindezt úgy, hogy bármilyen platformra elérhető, a telefontól a felhőig.

Mire figyelnek a vállalati felhasználók?

A Google mind a betanított alapmodelleket, mind a feladatspecifikus változatokat elérhetővé tette, utóbbiak kulcsfontosságúak, ha valaki a saját szakterületére szeretne finomhangolni. Korábban a Gemma-alapmodellek jó kiindulópontnak bizonyultak, az Apache 2.0 licenc pedig most már egyértelműen lehetővé teszi a kereskedelmi forgalomba helyezhető, továbbképzett modelleket.

Külön figyelmet érdemel, hogy a Google Cloudon elérhető szervermentes futtatás RTX Pro 6000 GPU-n jelentős költségcsökkentést hozhat: csak a tényleges használat után kell fizetni, nem terheli a céget a folyamatos GPU-költség.

A Google szerint a Gemma 4 család itt még nem ér véget, várhatóan további méretekben is érkeznek modellek. Ami most elérhető, az már most meghatározó: workstation-szintű problémamegoldás és edge-re optimalizált multimodalitás egy családon belül, átlátható jogi és technikai feltételekkel. A vállalati MI-piac végre tényleg egyenlő pályán versenyezhet – hosszas jogi egyeztetés nélkül.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 08:58

A kínai űrutántöltő műhold elhozza a szatellitek örök életét?

A Kína által fejlesztett Hukeda-2 műhold nagy áttörést ért el: robotikus „polipkarjával” sikeresen végrehajtott egy kulcsfontosságú üzemanyagutántöltési tesztet alacsony Föld körüli pályán...

MA 08:50

Az olcsó gyerekruhák árát az egészségükön fizethetik meg

Az utóbbi időben egyre több olcsó, gyorsdivatot követő gyerekruha kerül a boltok polcaira, hogy lépést tartsanak a gyorsan növő gyerekekkel...

MA 08:43

A NordVPN új, ingyenes helymeghatározója megmutatja, mennyit tudnak rólad

Egy új, teljesen ingyenes böngészős eszközt indított el a NordVPN, amely néhány kattintással megmutatja, mit tudnak rólad a webhelyek a tartózkodási helyed alapján...

MA 08:36

Az újabb átverés: kártékony kód érkezik Claude Code helyett

⚠ Több tízezer felhasználó sietett letölteni a kiszivárgott Claude Code forráskódot, azonban sokakat kellemetlen meglepetés ért: a várt fejlesztőeszköz helyett zárolást és adatlopási kísérleteket rejtő kártékony szoftvert húztak le a gépükre...

MA 08:29

A Tini Nindzsa Teknőcök végre VR-ban csapnak le: érkezik az Empire City

Cowabunga, technorajongók! Most minden Tini Nindzsa Teknőcök-rajongó eldobhatja az agyát, mert április 30-án érkezik a Tini Nindzsa Teknőcök: Empire City (Teenage Mutant Ninja Turtles: Empire City) VR-játék Meta Questre, SteamVR-ra és Pico-ra...

MA 08:22

A Google végre lép: mindennapossá válnak az MI‑videók

Jellemző példa erre, hogy amíg az OpenAI visszavonulót fúj a Sora MI‑videóplatformjával, a Google épp most emeli új szintre a böngészőből elérhető Google Vids szolgáltatását...

MA 08:08

A maradék zsemlemorzsa lehet a jövő hidrogénforrása?

🥖 A mindennapi élelmiszerhulladék, például a zsemlemorzsa, új szerephez juthat a vegyiparban: brit kutatók áttörő eljárást fejlesztettek ki, amellyel ebből a hulladékból hidrogént lehet előállítani...

MA 08:01

Az új HP Z8 Fury: a PC-k koronázatlan királya

A HP legújabb erőgépe, a Z8 Fury G6i letarolja a munkaállomás‑piacot, ha valaki komoly MI‑ vagy szimulációs munkákhoz keres kompromisszumok nélküli számítási teljesítményt...

MA 07:57

Az ősi mágneses káosz titkát végre megfejtették

🔮 Földünk mintegy 630 és 540 millió évvel ezelőtti Ediacara-időszaka az egyik legrejtélyesebb periódusnak számít a bolygó mágneses múltjának kutatásában...

MA 07:50

Az észak-koreai hekkerek kirabolták a Driftet – 100 milliárd forint a kár

Tipikus eset, amikor a kriptovilág védelmi rendszerei csődöt mondanak: a Drift Protocolból 280 millió dollár, azaz mintegy 100 milliárd forint tűnt el egy profi kibertámadás során, miután a támadók megszerezték a Security Council adminisztrátori jogait...

MA 07:36

Az üres ingatlanok aranykora: így zsákmányolják ki a postát a csalók

🔒 A kibercsalás világa már túlmutat a klasszikus hekkereken és vírusokon: az elmúlt években egyre többen használnak ki jogos szolgáltatásokat, példa erre az üresen álló otthonok postai címének lenyúlása...

MA 07:29

Az új lézeres hálózat feleannyi energiából viszi a netet

€ optic;📺 Vizsgálják, képes-e a vezeték nélküli technológia forradalmi újítása nagyságrendekkel gyorsabb internetet biztosítani minimális energiafogyasztással...

MA 07:22

A ropogósabb, diétásabb hasábburgonya titka: a mikrohullámú sütő

Forradalmi eljárás született, amellyel sokkal egészségesebbé válhat a kedvenc hasábburgonyánk. Amerikai kutatók olyan technikát fejlesztettek ki, amely ötvözi a hagyományos olajban sütést a mikrohullámú sütő alkalmazásával...

MA 07:08

Az FBI újabb blamája: kínai hackerek ismét lecsaptak

Az FBI szerint kínai hackerek betörtek egy kormányzati megfigyelőrendszerbe, amely érzékeny, belföldi rendvédelmi adatokhoz biztosított hozzáférést...

MA 07:01

A Garmin bedobja magát: okosóra a női egészségért

Mostantól a Garmin női felhasználói lazán felveszik a versenyt az Apple-lel és az Oura-val, ugyanis a legfrissebb frissítéssel bekapcsolódott a Natural Cycles-integrációba...

MA 07:00

Az MI-óriás Mercor adatvesztése: Ellopható a jövőnk?

Tipikus eset, amikor egy ígéretes techvállalkozást éppen felfelé ívelő pályáján ér kiberbűnözői támadás...

MA 06:50

Az éleslátás jövője: forradalmi módszer óvhatja a szemed

👀 A kutatók áttörést értek el az éleslátásért felelős sejtek védelmében: több mint 2 700 vegyületet vizsgáltak laborban növesztett emberi ideghártya-modelleken, és olyan anyagokat találtak, amelyek képesek megelőzni a színek és arcok felismeréséért felelős csap-receptorok pusztulását...

MA 06:44

Az energiaegyenleg durván felborult: Csődöt mondtak a klímamodellek?

Ez a jelenség jól illusztrálható azzal, hogy a Föld egyre több energiát nyel el a Napból, mint amennyit képes visszasugározni az űrbe, és ez a különbség – az úgynevezett energiaegyensúlyi zavar – minden eddigi elképzelést felülmúl...

MA 06:36

Az OpenAI beköltözteti a ChatGPT-t az autódba – Siri, reszkess!

Na most kapaszkodj, mert már az autóban is cseverészhetsz a ChatGPT-vel!..

MA 06:29

Az új fogyasztótabletták: indul a nagy GLP–1-verseny

💪 Az elhízás elleni gyógyszerpiacon új korszak kezdődött: az FDA engedélyezte a második GLP-1‑alapú tablettát, amely Foundayo néven kerül piacra...

MA 06:21

Az ősi kínai leletek átírják az állatok evolúcióját

Lényeges szempont, hogy Kína déli részén, Jünnan tartományban több száz, szinte földönkívülinek tűnő ősmaradvány került elő; ezek átírják elképzelésünket a Földön zajló életfejlődésről...

MA 06:16

A szuverenitás nagy áttörése az MI-válság után: megérkezett a Trinity

Az Arcee MI új, nyílt forráskódú Trinity-Large-Thinking modellje ritka kivétel az amerikai MI-modellek között: letölthető, tetszés szerint testre szabható, és szabadon használható a legnagyobb vállalatok vagy független fejlesztők számára...

MA 06:08

Az Amazon űrháborút hirdet a Starlink ellen

Az Amazon éppen tárgyalásokat folytat a műholdas távközlési piacon jelentős szereplőnek számító Globalstar felvásárlásáról...

MA 06:05

Történelmi események a mai napon (Április 3.)

Rövid történelmi körkép: ezen a napon elfoglalták Richmondot az Amerikai polgárháborúban, Sztálin lett a Szovjetunió Kommunista Pártjának főtitkára, Martin Luther King Jr...

csütörtök 21:56

Az X szigorít: zárolás vár az első kriptós posztolókra

Elon Musk közösségi oldala, az X újabb lépést tesz a kriptós átverések visszaszorítására...

csütörtök 21:46

A netes tévézés trónjáért: YouTube TV vagy Hulu + Live TV?

A kábeltévéről való lemondás sosem volt egyszerűbb, mint ma, a YouTube TV és a Hulu Plus Live TV kínálatával...

csütörtök 21:34

A Google Vids megérkezett: ingyenes videók egy kattintással

A minőségi videók készítése korábban bonyolult technikát, költséges felszerelést és órákig tartó utómunkát igényelt...

csütörtök 21:23

Az Android lehagyja az iOS-t az értesítések kezelésében

Az Android eddig is sokkal hatékonyabban kezelte az értesítéseket, mint az iOS, ami nemcsak az alkalmazások újításaiban, hanem a testreszabási lehetőségekben is megmutatkozik...

csütörtök 21:11

A linuxos Steam átlépte az 5%-ot – Végre indul a játék?

Márciusban hatalmasat ugrott a linuxos játékosok aránya a Steamen: végre sikerült átlépni az eddig soha el nem ért 5%-os küszöböt...