2026. 04. 03., 07:17

Itt a Gemma 4: végre egy valóban nyílt Google-modell

Itt a Gemma 4: végre egy valóban nyílt Google-modell
A Google alaposan felforgatta az MI-modellek piacát: a Gemma 4 család immár Apache 2.0 licenc alatt szabadon használható, így megszűntek a korábbi, bonyolult jogi megkötések. Ez a döntés nemcsak technológiai, hanem jogi szempontból is mérföldkő, mivel a Gemma eddig a saját engedélyével nehezítette a széles körű vállalati adaptációt. Most viszont valódi nyílt forrású alternatívát kínál, amely teljes mértékben versenybe száll a Mistral, az Alibaba Qwen vagy az Arcee mellett – anélkül, hogy le kellene ülni a jogi osztállyal konzultálni minden egyes felhasználás előtt.

Négy modell, két kategória: a felhőtől a mobilig

A Gemma 4 két fő vonalat képvisel négy modellel. A „workstation” csoportban egy 31 milliárd paraméteres sűrű modell és egy 26 milliárd paraméteres, aktív szakértőkkel dolgozó „Mixture-of-Experts” építésű modell található. Mindkettő támogatja a szöveg- és képbemenetet, sőt, 256 ezer tokenes kontextusablakot is kezel. Az „edge” irányban két kisebb változat, az E2B és E4B érhető el, amelyeket okostelefonokra, beágyazott eszközökre és laptopokra optimalizáltak, és támogatják a szöveg-, kép- és hangfeldolgozást is, 128 ezer tokenig.

A modellek neveiben az „E” az „effective parameters”-t jelzi: például az E2B ténylegesen 2,3 milliárd paramétert mozgat, bár összességében 5,1 milliárd paramétere van, mivel minden dekóderréteg saját beágyazási táblával dolgozik a Google saját fejlesztésű Per-Layer Embeddings technológiájával. Ez a megoldás a lemezen sok helyet foglal, de futásidőben kevés erőforrást igényel.

Az „A” betű a 26B A4B modellben „active parameters”-t jelent: a 25,2 milliárd összparaméterből egyszerre csak 3,8 milliárd dolgozik, így a modell számítási igénye egy 4B kategóriás modellhez mérhető, miközben a tudása közelít a 26B szinthez.

Külön figyelmet érdemel, hogy a MoE-architektúrával spórolhatunk

A 26B A4B modell különleges felépítésének köszönhetően a futtatás költségei drasztikusan csökkenthetők. Míg más nagy MoE-modellek néhány hatalmas szakértőt alkalmaznak, a Gemma 128 kicsi szakértőt, amelyek közül tokenenként 8-at (plusz egy univerzálisan aktív szakértőt) használ. Ez lehetővé teszi, hogy a 26B méretű modellekhez mérhető teljesítményt érjünk el, de a számításigénye egy 4B modellével egyezik meg.

Ugyanígy mindkét workstation-modell hibrid figyelmet alkalmaz: a helyi, csúszóablakos figyelmet ötvözi a teljes globális figyelemmel, ahol az utolsó réteg mindig globális. Így érhető el a 256 ezres kontextusablak, miközben a memóriahasználat kordában marad – ez kulcsfontosságú a hosszú dokumentumok, kódok vagy többlépcsős ügynökbeszélgetések feldolgozásánál.

Multimodalitás az alapoktól: látás, hang és funkcióhívás natívan

A korábbi nyílt modellekben a multimodalitás mindig utólagos toldozás-foldozás volt. Az új Gemma 4 viszont már az architektúra szintjén natív módon kezeli a látást, a hangot és a funkcióhívásokat.

A négy modell mindegyike támogatja a változó képarányú vizuális inputot, rugalmas vizuális tokenköltségvetéssel (70–1 120 token képenként). Ezzel szemben a Gemma 3 még nehézkesen boldogult OCR-rel és dokumentumértelmezéssel. Most alacsony tokenkeret mellett egyszerű címkézés és képaláírás, magasabb keretnél dokumentumszkennelés, OCR vagy részletes képelemzés is lehetséges. Natívan kezeli a többképes és videóbemenetet, így egyszerre több dokumentum vagy képernyőkép összefüggéseit is értelmezheti a modell.

Az edge modellek önálló hangfeldolgozással is bírnak: automatikus beszédfelismerés és beszédfordítás valósul meg az eszközön, a hangkódoló méretét 681 millióról 305 millió paraméterre csökkentették, a frameidő 160 ms-ról 40 ms-ra rövidült, így gyorsabb az átírás. Az egészségügyben, helyszíni munkavégzés során vagy többnyelvű ügyfélszolgálaton így minden helyben, egyetlen modellen futhat.

Minden modell natívan tud funkciókat hívni, vagyis külső eszközökkel, API-kkal strukturáltan tud együttműködni több lépésen át. Ennek köszönhetően kevesebb promptmérnöki munkára van szükség, üzleti szinten lényegesen egyszerűbbé válik egyedi MI-alapú ügynökök létrehozása.


Meggyőző benchmarkok és valódi előrelépés

A Gemma 4 mérései látványosan jobbak az előző generáció eredményeinél. A 31B-es sűrű modell 89,2%-ot ért el AIME 2026 matematikai teszten, 80%-ot a LiveCodeBench V6-on, Codeforces Elo-n 2 150 pontot hozott – régen ez csak zárt modellektől volt elvárható. Látásban a MMMU Pro 76,9%, a MATH-Vision 85,6% eredményre képes.

A 26B MoE A4B modell csak hajszállal marad el: AIME-on 88,3%, LiveCodeBench-en 77,1%, a GPQA Diamond tudományos teszten 82,3%. Az edge modellek az E4B-vel 42,5% (AIME) és 52% (LiveCodeBench), az E2B-vel 37,5% és 44% pontot szereztek – mindezt mindössze egy T4 GPU-n vagy kisebb eszközökön.

Fontos, hogy a Gemma 4 nemcsak egyetlen mutatóban jó: kombinálja az erős érvelést, a szöveg-, kép- és hangterületen natív multimodalitást, a funkcióhívást, a 256 ezer tokenes kontextust és a szabad felhasználást – mindezt úgy, hogy bármilyen platformra elérhető, a telefontól a felhőig.

Mire figyelnek a vállalati felhasználók?

A Google mind a betanított alapmodelleket, mind a feladatspecifikus változatokat elérhetővé tette, utóbbiak kulcsfontosságúak, ha valaki a saját szakterületére szeretne finomhangolni. Korábban a Gemma-alapmodellek jó kiindulópontnak bizonyultak, az Apache 2.0 licenc pedig most már egyértelműen lehetővé teszi a kereskedelmi forgalomba helyezhető, továbbképzett modelleket.

Külön figyelmet érdemel, hogy a Google Cloudon elérhető szervermentes futtatás RTX Pro 6000 GPU-n jelentős költségcsökkentést hozhat: csak a tényleges használat után kell fizetni, nem terheli a céget a folyamatos GPU-költség.

A Google szerint a Gemma 4 család itt még nem ér véget, várhatóan további méretekben is érkeznek modellek. Ami most elérhető, az már most meghatározó: workstation-szintű problémamegoldás és edge-re optimalizált multimodalitás egy családon belül, átlátható jogi és technikai feltételekkel. A vállalati MI-piac végre tényleg egyenlő pályán versenyezhet – hosszas jogi egyeztetés nélkül.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...

kedd 11:34

A Starlink mellett veszélyesen darabokra hullott egy kínai rakéta

Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...