2026. 04. 03., 07:17

Itt a Gemma 4: végre egy valóban nyílt Google-modell

Itt a Gemma 4: végre egy valóban nyílt Google-modell
A Google alaposan felforgatta az MI-modellek piacát: a Gemma 4 család immár Apache 2.0 licenc alatt szabadon használható, így megszűntek a korábbi, bonyolult jogi megkötések. Ez a döntés nemcsak technológiai, hanem jogi szempontból is mérföldkő, mivel a Gemma eddig a saját engedélyével nehezítette a széles körű vállalati adaptációt. Most viszont valódi nyílt forrású alternatívát kínál, amely teljes mértékben versenybe száll a Mistral, az Alibaba Qwen vagy az Arcee mellett – anélkül, hogy le kellene ülni a jogi osztállyal konzultálni minden egyes felhasználás előtt.

Négy modell, két kategória: a felhőtől a mobilig

A Gemma 4 két fő vonalat képvisel négy modellel. A „workstation” csoportban egy 31 milliárd paraméteres sűrű modell és egy 26 milliárd paraméteres, aktív szakértőkkel dolgozó „Mixture-of-Experts” építésű modell található. Mindkettő támogatja a szöveg- és képbemenetet, sőt, 256 ezer tokenes kontextusablakot is kezel. Az „edge” irányban két kisebb változat, az E2B és E4B érhető el, amelyeket okostelefonokra, beágyazott eszközökre és laptopokra optimalizáltak, és támogatják a szöveg-, kép- és hangfeldolgozást is, 128 ezer tokenig.

A modellek neveiben az „E” az „effective parameters”-t jelzi: például az E2B ténylegesen 2,3 milliárd paramétert mozgat, bár összességében 5,1 milliárd paramétere van, mivel minden dekóderréteg saját beágyazási táblával dolgozik a Google saját fejlesztésű Per-Layer Embeddings technológiájával. Ez a megoldás a lemezen sok helyet foglal, de futásidőben kevés erőforrást igényel.

Az „A” betű a 26B A4B modellben „active parameters”-t jelent: a 25,2 milliárd összparaméterből egyszerre csak 3,8 milliárd dolgozik, így a modell számítási igénye egy 4B kategóriás modellhez mérhető, miközben a tudása közelít a 26B szinthez.

Külön figyelmet érdemel, hogy a MoE-architektúrával spórolhatunk

A 26B A4B modell különleges felépítésének köszönhetően a futtatás költségei drasztikusan csökkenthetők. Míg más nagy MoE-modellek néhány hatalmas szakértőt alkalmaznak, a Gemma 128 kicsi szakértőt, amelyek közül tokenenként 8-at (plusz egy univerzálisan aktív szakértőt) használ. Ez lehetővé teszi, hogy a 26B méretű modellekhez mérhető teljesítményt érjünk el, de a számításigénye egy 4B modellével egyezik meg.

Ugyanígy mindkét workstation-modell hibrid figyelmet alkalmaz: a helyi, csúszóablakos figyelmet ötvözi a teljes globális figyelemmel, ahol az utolsó réteg mindig globális. Így érhető el a 256 ezres kontextusablak, miközben a memóriahasználat kordában marad – ez kulcsfontosságú a hosszú dokumentumok, kódok vagy többlépcsős ügynökbeszélgetések feldolgozásánál.

Multimodalitás az alapoktól: látás, hang és funkcióhívás natívan

A korábbi nyílt modellekben a multimodalitás mindig utólagos toldozás-foldozás volt. Az új Gemma 4 viszont már az architektúra szintjén natív módon kezeli a látást, a hangot és a funkcióhívásokat.

A négy modell mindegyike támogatja a változó képarányú vizuális inputot, rugalmas vizuális tokenköltségvetéssel (70–1 120 token képenként). Ezzel szemben a Gemma 3 még nehézkesen boldogult OCR-rel és dokumentumértelmezéssel. Most alacsony tokenkeret mellett egyszerű címkézés és képaláírás, magasabb keretnél dokumentumszkennelés, OCR vagy részletes képelemzés is lehetséges. Natívan kezeli a többképes és videóbemenetet, így egyszerre több dokumentum vagy képernyőkép összefüggéseit is értelmezheti a modell.

Az edge modellek önálló hangfeldolgozással is bírnak: automatikus beszédfelismerés és beszédfordítás valósul meg az eszközön, a hangkódoló méretét 681 millióról 305 millió paraméterre csökkentették, a frameidő 160 ms-ról 40 ms-ra rövidült, így gyorsabb az átírás. Az egészségügyben, helyszíni munkavégzés során vagy többnyelvű ügyfélszolgálaton így minden helyben, egyetlen modellen futhat.

Minden modell natívan tud funkciókat hívni, vagyis külső eszközökkel, API-kkal strukturáltan tud együttműködni több lépésen át. Ennek köszönhetően kevesebb promptmérnöki munkára van szükség, üzleti szinten lényegesen egyszerűbbé válik egyedi MI-alapú ügynökök létrehozása.


Meggyőző benchmarkok és valódi előrelépés

A Gemma 4 mérései látványosan jobbak az előző generáció eredményeinél. A 31B-es sűrű modell 89,2%-ot ért el AIME 2026 matematikai teszten, 80%-ot a LiveCodeBench V6-on, Codeforces Elo-n 2 150 pontot hozott – régen ez csak zárt modellektől volt elvárható. Látásban a MMMU Pro 76,9%, a MATH-Vision 85,6% eredményre képes.

A 26B MoE A4B modell csak hajszállal marad el: AIME-on 88,3%, LiveCodeBench-en 77,1%, a GPQA Diamond tudományos teszten 82,3%. Az edge modellek az E4B-vel 42,5% (AIME) és 52% (LiveCodeBench), az E2B-vel 37,5% és 44% pontot szereztek – mindezt mindössze egy T4 GPU-n vagy kisebb eszközökön.

Fontos, hogy a Gemma 4 nemcsak egyetlen mutatóban jó: kombinálja az erős érvelést, a szöveg-, kép- és hangterületen natív multimodalitást, a funkcióhívást, a 256 ezer tokenes kontextust és a szabad felhasználást – mindezt úgy, hogy bármilyen platformra elérhető, a telefontól a felhőig.

Mire figyelnek a vállalati felhasználók?

A Google mind a betanított alapmodelleket, mind a feladatspecifikus változatokat elérhetővé tette, utóbbiak kulcsfontosságúak, ha valaki a saját szakterületére szeretne finomhangolni. Korábban a Gemma-alapmodellek jó kiindulópontnak bizonyultak, az Apache 2.0 licenc pedig most már egyértelműen lehetővé teszi a kereskedelmi forgalomba helyezhető, továbbképzett modelleket.

Külön figyelmet érdemel, hogy a Google Cloudon elérhető szervermentes futtatás RTX Pro 6000 GPU-n jelentős költségcsökkentést hozhat: csak a tényleges használat után kell fizetni, nem terheli a céget a folyamatos GPU-költség.

A Google szerint a Gemma 4 család itt még nem ér véget, várhatóan további méretekben is érkeznek modellek. Ami most elérhető, az már most meghatározó: workstation-szintű problémamegoldás és edge-re optimalizált multimodalitás egy családon belül, átlátható jogi és technikai feltételekkel. A vállalati MI-piac végre tényleg egyenlő pályán versenyezhet – hosszas jogi egyeztetés nélkül.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 06:44

Az MI ellen fordul a közvélemény: tiltakozáshullám a központok ellen

😡 Fontos kérdés, hogy mi adja az MI-fejlesztések valós értékét, amikor az amerikai lakosság egyre szkeptikusabb a technológia jövőjével kapcsolatban...

MA 06:36

A Spotify életet lehel a független koncerthelyekbe

Jellemző, hogy az élő zene világa mostanában nagy hullámokat vet: miközben egyes fesztiválok elképesztő koncertekkel indították a szezont, a jegyértékesítő óriásokat súlyos vádak érték a közönség kizsákmányolása miatt...

MA 06:30

Az elveszett dínókoponya, amely felforgatta a történelmet

🔝 Egy hosszú időre fiókba zárt, torz dinoszauruszkoponya teljesen új nézőpontot adott a dínók felemelkedéséről...

MA 06:23

A ThinkPad P14s Gen 6: az üzleti gép, ami mindent visz?

A Lenovo ThinkPad sorozata szinte egyet jelent a céges laptopok világával; a legendás gépek már az IBM aranykorában is ipari sztenderdnek számítottak, és a Lenovo 20 évvel ezelőtti átvétele óta ez a helyzet csak tovább erősödött...

MA 06:05

Történelmi események a mai napon (Április 16.)

Röviden: ikonikus fordulópontok sora esett erre a napra a történelemben – Masada eleste, a Battle of Culloden (Cullodeni csata), Lenin hazatérése és a Rapallói szerződés mind mély nyomot hagytak...

MA 06:02

Az arccsere előcsalogatja gyerekkorunk elveszett emlékeit

Ahogy az évek telnek, a gyerekkor legszebb pillanatai gyakran úgy halványulnak el, mint a tengerparton szétfolyó hab...

szerda 21:45

Az új Recall újabb botrányt hozott a Microsoftnak

💥 A Windows 11-hez kapcsolódó Recall 2024-es debütálása óta soha nem nyerte el a felhasználók bizalmát...

szerda 21:24

A holdbázisig 73 leszállás és kőkemény akadály vár a NASA-ra

🚲 Ilyen tévhit például, hogy emberes holdbázist építeni már csak technikai kérdés...

szerda 20:57

Az Alzheimer-botrány: zsákutcába futott az amiloid-elmélet?

Több mint száz éve ismerjük az Alzheimer-kórt, de a betegséget véglegesen visszafordító kezelés még mindig várat magára...

szerda 20:44

Az Amazon 10,8 milliárd dollárért bekebelezi a Globalstart az űrinternetért

Nem hiszem el, de most tényleg: az Amazon 10,8 milliárd dollárért (kb...

szerda 20:24

Az MI és a GitHub nagy érdemlopási csapdája: mire nem figyeltek?

🤔 A közelmúltban komoly aggodalomra adott okot, hogy a GitHubon futó népszerű MI-ügynökök könnyedén kicsalhatják a felhasználók hitelesítő adatait anélkül, hogy erről megfelelő figyelmeztetést kapnának az érintettek...

szerda 19:56

Az áprilisi frissítés után BitLocker-kulcsot kérnek a Windows-szerverek

🔒 Előfordul, hogy a legfrissebb Windows Server 2025 frissítések telepítése után egyes szerverek BitLocker-helyreállítási módba lépnek, és a rendszer a helyreállítási kulcs megadását kéri...

szerda 19:45

A Spotify-on már könyveket is vehetsz – nem vicc!

A Spotify újabb meglepetéssel állt elő: mostantól fizikai könyveket is vásárolhatsz az alkalmazáson belül...

szerda 19:34

Az új Windows Task Host-hiba: tényleg van okunk aggódni?

A Windows Task Host nevű rendszerkomponens súlyos sérülékenysége miatt ismét veszélybe kerülhetnek a felhasználók és szervezetek: a sebezhetőség kihasználásával rosszindulatú támadók akár teljes rendszergazdai jogosultságot szerezhetnek a megfertőzött eszközökön...

szerda 19:23

Az USA légterében zöld utat kaptak a drónvadász lézerfegyverek

Az Amerikai Szövetségi Légügyi Hivatal (FAA) hivatalosan is jóváhagyta a drónok elleni nagyenergiájú lézerfegyverek bevetését az Egyesült Államok légterében...

szerda 19:12

A vadonatúj Gemini végre igazi Mac-élményt hoz

💻 Érdemes megvizsgálni, hogy mennyivel könnyebb és gyorsabb lett a Google Gemini használata Macen: mostantól nem kell böngészőt nyitni, elég letölteni a natív macOS-alkalmazást – így közvetlenül az asztalról indítható a Google MI-chatbotja...

szerda 18:46

Az Adobe nagy dobása: egy MI irányítja az összes kreatív szoftvert

Az Adobe ma új korszakot nyitott a kreativitásban: bemutatta a vadonatúj Firefly MI Assistantot, amely képes egyszerre irányítani a cég összes zászlóshajó-alkalmazását – legyen szó Photoshopról, Premieréről vagy Illustratorról...

szerda 18:34

Az élet nyomai: földönkívüliek rejtőzhetnek a mintákban

A kutatók egyik legnagyobb kihívása az, hogy miként azonosítható az élet idegen bolygókon, amikor a klasszikus jelek, például a biomarkerek vagy bizonyos gázok, más folyamatokból is származhatnak...

szerda 18:23

Az önvezető autók igazi tűzpróbája: London káosza

🚗 Érdekes felvetés, hogy az amerikai utakon már jól vizsgázó önvezető autók mire mennek London szűk utcáin...

szerda 17:23

A zsebben elfér: a világ legkisebb e-könyv-olvasója

Az a miniatűr e-könyv-olvasó, amelyet egy lelkes YouTuber, Paul Lagier fejlesztett ki 3D-nyomtatott házzal és házilag összeállítható elektronikai alkatrészekkel, alig nagyobb egy felnőtt hüvelykujjánál...

szerda 17:01

Az asztalra kattintasz, és eltűnnek: a Windows 11 utoléri a Macet

Ebből következően érdemes megérteni, hogy a Windows 11 most egy meglepően alap, de annál kényelmesebb funkcióval bővült: egy kicsi, ötletes segédprogrammal, amely leveszi az állandó ablakzsonglőrködés terhét, főleg, ha túl sok program fut egyszerre...

szerda 16:45

Az automata Windows-frissítés megint bakizott, de nem lesz 2025-ös a szervered

Az elmúlt évben sok rendszergazda szembesült azzal, hogy a Windows Server 2019 vagy 2022 rendszerük egyik napról a másikra, szinte varázsütésre Windows Server 2025-re frissült – ráadásul sokszor anélkül, hogy bárki licencet szerzett volna rá...

szerda 16:24

A mesterséges intelligencia nemcsak a Szilícium-völgyé: Demis Hassabis londoni diadala

💻 Vannak, akik már gyermekkorukban is komoly tehetségről tesznek tanúbizonyságot. Demis Hassabis is közéjük tartozik: hatévesen még csak szülei bátorítását hallgatta, de már ekkor elgondolkodott azon, hogy mit is jelent igazán a legjobbat nyújtani...

szerda 16:14

Az Apple Watch vagy a Whoop Band: melyik illik hozzád jobban?

Az okosórák és fitnesz-karkötők piaca hatalmas ugrásokon megy keresztül, különösen olyan innovációknak köszönhetően, mint a mesterséges intelligencia, amely a nyers egészségügyi adatokat hasznos tanácsokká alakítja át...

szerda 16:01

Az aranyszínű grafén átírja a fizika egyik alaptörvényét

A tudományban ritka pillanat, amikor az anyagok viselkedése teljesen átír egy jól ismert fizikai törvényt...

szerda 15:56

Az új MI-ikonokat imádják a Pixel-tulajok, mégis hiányzik valami

😍 A Google legutóbbi újítása, a Pixel Launcher MI által generált egyedi ikonjai, azonnal megnyerték a felhasználók többségének tetszését...

szerda 15:46

Az ősi szerszámok titka: kapcsolódott-e a Homo erectus a kozmoszhoz?

🔬 Izraelben rendkívüli régészeti leletre bukkantak: a Sakhnin-völgyben legalább tíz olyan őskori kőbaltát találtak, amelyeket nem véletlenszerűen, hanem tudatosan, különleges ásványi anyagok, kövületek és geodák felhasználásával készítettek...

szerda 15:34

Az új Steam árfigyelő mindenkinek beválik, vagy megint félmegoldás?

💸 A Valve nagy erőkkel dolgozik a Steam Machine piacra dobásán, de miközben a RAM- és tárhelyhiány miatt a konzol-PC bevezetése csúszhat, a cég folyamatosan készíti elő a digitális bolt fontos funkcióit is...

szerda 15:13

Az agytorna késleltetheti az Alzheimer-kórt – ez lehet a kulcs?

Az élet során végzett, szellemileg megterhelő tevékenységek, mint az olvasás, az írás vagy idegen nyelvek tanulása, jelentősen befolyásolhatják az időskori agy egészségét...