MA 11:34

A Google DiffusionGemma 256 tokent generál párhuzamosan, közben javít

A Google DiffusionGemma 256 tokent generál párhuzamosan, közben javít
Bár az MI-alapú képgenerátorok, például a Stable Diffusion, már régóta kihasználják a diffúzió elvét, a szöveggenerálás világában eddig nem sikerült ezt hasonló nagyságrendben alkalmazni. Most a DiffusionGemma, a Google új, nyílt forráskódú modellje forradalmi módon viszi ezt a szöveges MI területére: képes egyszerre 256 szövegelem létrehozására, ráadásul a folyamat közben önmagát is korrigálja. Mindez jelentős sebességnövekedést biztosít az eddigi szekvenciális működéshez képest, és új lehetőségeket nyit a helyi, kisebb léptékű MI-rendszerek számára.

Új generációs szövegalkotás

A DiffusionGemma nem bonyolódik bele a hagyományos, tokenenkénti, balról jobbra haladó dekódolásba. Ehelyett 256 véletlenszerű helykitöltő elemmel indít, amelyeket párhuzamosan, lépésről lépésre finomít. Minden iteráció során a modell felméri, mely pozíciókban a legbiztosabb, ezeket rögzíti, míg a bizonytalanokat ismételten vizsgálja – egészen addig, amíg elég pozíció stabilizálódik ahhoz, hogy a maradékot is magabiztosan meg lehessen jósolni.
Bár a DiffusionGemma sebességben kiemelkedő, a Google maga is hangsúlyozza: ahol a legmagasabb minőség a cél, ott a standard Gemma 4 még mindig megelőzi.

Az önjavítás és a kétirányú figyelem előnyei

A DiffusionGemma képessége, hogy a korábbi hibás választásokat újragondolja, nagy előnyt ad. Az autoregresszív modellek beleragadnak a hibába, mert a következő elemek már az előzőre épülnek, ám itt az alacsony magabiztosságú pontok átírhatók a következő körben. Emellett a blokkon belül mindegyik pozíció figyel minden másikra – így a jövőbeli szavak kontextusa is befolyásolja az aktuális döntéseket. Struktúrájából fakadóan különösen jól teljesít olyan feladatoknál, ahol szigorú megkötések vagy előre-hátra ható kontextus szükséges. Az MI-t például Sudoku-feladványokhoz hangolva, különösebb tanítás nélkül 0%-os sikerarányról 80%-os találati arányra ugrott, és látványosan gyorsabb lett: 48 lépés helyett 12 is elég volt a helyes megoldáshoz.

Fejlesztési részletek

A DiffusionGemma 26 milliárd paraméterből áll, azonban csak 3,8 milliárdot aktivál futás közben. Kvantált formában mindössze 18 GB VRAM kell hozzá, így még az otthoni RTX 4090 és 5090 videokártyákon is futhat. Mind a Google, mind az NVIDIA gondoskodott a vállalati szintű Hopper- és Blackwell-szerverek optimalizálásáról, NVFP4 kernellel. Az integrációhoz a vLLM platformba átdolgozták a figyelmi logikát is, mert a DiffusionGemma váltogatja az ok-okozati és kétirányú figyelmet az egyes lépések között. Ehhez új, általánosítható ModelState interfészt is fejlesztettek.


Gyors, de nem mindenhol

A DiffusionGemma előnyei leginkább akkor érvényesülnek, ha egyetlen felhasználó dolgozik dedikált GPU-n, vagy alacsony a lekérdezés párhuzamossága. Ilyen körülmények között az FP8 verzió egy NVIDIA H100-on akár 1008, egy H200-on 1288 szót is generál másodpercenként – ami 5–6-szoros gyorsulást jelent a standard autoregresszív modellekhez képest. Nagyszámú, szerverközpontú felhasználásnál azonban az előny visszafogott, hiszen ott az MI már most is maximálisan kihasználja az erőforrásokat.

Különbségek és kompromisszumok

Külső szemmel nézve a DiffusionGemma legizgalmasabb újdonsága, hogy áttörte az eddigi méretkorlátozásokat: 26 milliárd paraméter, natív vLLM-integráció, általános célú, instrukcióra hangolt működés. Szemben a spekulatív dekódolással – ahol egy kisebb nyers modell előre találgat, majd az eredetitől igazolást kap – a DiffusionGemma nem csupán dekódolási trükk, hanem újfajta alkotás. Lényeges kompromisszum, hogy összminőségben a standard Gemma 4 még megelőzi, de strukturált, kontextusérzékeny MI-feladatoknál, például kód-kiegészítés vagy sablongyártás során kiemelkedően teljesít.

Új távlatok vállalati felhasználásban

A DiffusionGemma már most is elérhető OpenAI-kompatibilis vLLM-végpontokon, különösebb módosítás nélkül. Most először van választási lehetőség: kisebb késleltetés érhető el dedikált hardverrel, minőségromlás nélkül, a helyi vagy kevés felhasználós rendszerekben. Strukturált szöveggenerálásnál a kétirányú figyelem hatalmas előnyt jelenthet – GIS-szoftvertől a kódgenerálásig. A történet tanulsága egyértelmű: a DiffusionGemma nem mindenkinek való, de ahol nyer, ott igazán nagyot nyer.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 13:01

A Metaplanet felvásárolja a Siiibo Securities-t: gyorsul a bitcoin-forradalom

🚀 Érdemes megvizsgálni, hogy egy friss japán felvásárlással a Metaplanet jelentős lépést tett a digitális pénzügyi rendszer átalakítása felé...

MA 12:56

Az MI forradalmasítja a számlacsalás elleni küzdelmet

A mesterséges intelligencia (MI) néhány év alatt gyökeresen átalakította a vállalatok mindennapjait, és különösen a pénzügyi csapatok működésében hozott jelentős változásokat...

MA 12:45

Az Apple szerint Siri segít, nem randizik veled – odaszúrás a ChatGPT-nek

😉 Különösen említést érdemel, hogy az Apple végre részletesen bemutatta, miben lesz más az év végén érkező, teljesen megújult Siri a többi, mesterséges intelligenciára épülő digitális asszisztenshez képest...

MA 12:35

Az eljárás, amely véget vetett a napi tucatnyi szívleállásnak

Mindennapi tevékenységek is komoly veszélyt jelenthetnek bizonyos szívbetegséggel élőknél. Egy ritka állapot, a kardioinhibitórikus szinkópe miatt egyesek akár naponta tucatnyi alkalommal elveszíthetik az eszméletüket...

MA 12:24

A felhőleállásokra nem készültél fel? Pedig kellene.

☁ A mai gazdaság elképesztő mértékben támaszkodik a felhőszolgáltatásokra: az Európai Unióban a cégek több mint 53%-a, néhány országban pedig majdnem 80%-a használ valamilyen fizetős felhőmegoldást...

MA 11:24

Percről percre: Bitcoin 75 ezret céloz, japán jegybank 31 éves csúcsra emel

📈 Egy lényeges szempont, hogy a tőzsdék történetének eddigi legnagyobb nyilvános részvénykibocsátása körül forog a világ pénzügyi figyelme: a SpaceX tőzsdei premierjére kiéhezve lendül felfelé a kriptovaluták piaca is...

MA 11:12

A százéves TBC-oltás áttörést hozhat a cukorbetegség kezelésében – de hogyan?

💉 Egy évszázados tuberkulózis elleni vakcina, amelyet eddig főleg fertőző betegségek megelőzésére és bizonyos daganatfajták kezelésére alkalmaztak, új reményt kínálhat a cukorbetegek számára...

MA 11:01

A bitcoin igazi mélypontja még odébb van

A vezető kriptovaluta, a bitcoin az elmúlt napokban visszapattant 64 000 dollárra (kb...

MA 10:55

Az XRP 3%-kal 1,14 dollár fölé, az intézményi vétel kulcsellenállást tesztel

Az XRP mostanában ritkán látott erőre kapott, amikor hatalmas forgalom mellett visszatért az 1,14 dolláros (kb...

MA 10:46

Az ICC női T20-vb 2026: így nézheted ingyen, menetrend, csapatok

🏏 A világ tizenkét legjobb női krikettcsapata idén nyáron, június 12. és július 5...

MA 10:37

A SpaceX kriptotőzsdei IPO-ja újra szárnyal: 2,4 billió dollár.

🚀 A SpaceX nevét viselő, blokklánc-alapú és kriptotőzsdén elérhető örökös szerződés (SPCX) jelentős fordulatot vett a hét végére...

MA 10:28

Miért nem engednek kiszállni a mechből? Öt év az ára.

A mech-játékok kedvelői általában arra vágynak, hogy necsak monumentális gépeikkel harcolhassanak, hanem ki is szállhassanak a pilótafülkéből, és felfedezhessék a világot emberként is...

MA 10:19

Az El Niño itt van: a valaha mért legerősebbek között

🌞 Az El Niño éghajlati jelenség hivatalosan megérkezett, és minden jel arra utal, hogy idén a történelem egyik legerősebbje lesz...

MA 09:55

A Coinbase MI-ügynökei már helyetted kereskednek és költenek

💰 A Coinbase új korszakot nyitott a digitális pénzügyekben: az úgynevezett „Coinbase for Agents” platformon keresztül intelligens asszisztensek, mint a ChatGPT vagy a Claude, mostantól képesek összekapcsolódni a felhasználók számláival, hogy kriptopénzzel kereskedjenek, adatokhoz férjenek hozzá, sőt, hamarosan önállóan fizessenek és vásároljanak is...

MA 09:46

Az örök fagy mókusürüléke mamutok, bölények, lovak és nagymacskák DNS-ét rejti

🦜 Érdekes felvetés, hogy néhány fagyott mókusürülék mennyire képes feltárni a hajdani élővilág gazdagságát...

MA 09:37

A Tejút visszatér: így készíts lélegzetelállító nyári fotókat

Ilyen eset például, amikor a nyári napforduló elhozza a késő esti égbolt varázsát: júniusban a Tejút legfényesebb, legszebb részét láthatjuk az északi féltekéről...

MA 09:27

Az LG a blokkláncra viszi a reklámokat – az Arbitrum segít

Ilyen eset például, amikor egy világcég a hagyományos reklámozás helyett teljesen új megközelítést választ...

MA 09:19

A SpaceX minden idők legnagyobb tőzsdei kibocsátásával rekordot döntött

🚀 Elon Musk űripari vállalata, a SpaceX történelmi léptékű tőzsdei bevezetést hajtott végre: részvényeit 135 dolláros (kb...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/12

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     CrestWall – 4K Wallpapers (iPhone/iPad)A CrestWall egy gondosan válogatott, 4K felbontású háttérképeket kínáló alkalmazás, amelyet azoknak terveztek, akik fontosnak tartják iPhone-juk megjelenését...

MA 09:10

A britek fele egy csapásra tüntetné el az MI-t – főleg a fiatalok

🚀 Majdnem minden második brit felnőtt szívesen eltüntetné a generatív MI-t, ha tehetné...

MA 09:01

A TWID-ek búcsúznak: vége egy korszaknak a Destiny 2-ben

A Destiny 2-rajongók számára most egy korszak zárul le. A játék nemrég megkapta A Diadal Emlékműve (Monument of Triumph) frissítését, amely nagyjából lezárja a Destiny 2 hivatalos fejlesztéseit...

MA 08:55

Az akkumulátormentes eszköz a napfényt üzemanyaggá alakítja

Napfényből, vízből és szén-dioxidból üzemanyagot előállítani hosszú ideje a tudósok egyik legnagyobb álma...

MA 08:46

Az erőnléti edzés arany középútja a hosszabb élethez

💪 Érdemes megérteni, hogy napjainkban sokan keresik a hosszú élet kulcsát, de csak kevesen gondolnak arra, hogy a súlyzók vagy a saját testsúlyos edzés valódi aranybányát rejtenek...

MA 08:37

A Microsoft nyílt forrású SkillOptja súlyokhoz nyúlás nélkül turbózza az MI-ügynököket

🧠 A modern MI-ügynökök számtalan vállalati területen dolgoznak: összetett munkafolyamatokat hangolnak össze, segítenek adatokat elemezni és a mindennapi folyamatokat automatizálni...

MA 08:28

Az iOS 27 21 újdonsága, amire nem jutott idő a 2026-os WWDC-n

📶 Az iOS 27 nemcsak a megújult Siri MI-jétől lesz izgalmas, hanem olyan rejtett vagy kevésbé említett frissítésektől is, amelyek igazi örömet szerezhetnek az iPhone-felhasználóknak...

MA 08:19

Az MI-tesztek mit nem árulnak el a valós teljesítményről?

🤔 Ilyen eset például, amikor cégek hosszú hónapokat töltenek számítási kapacitás kiépítésével, GPU-k beszerzésével, felhőkörnyezet kialakításával, mindenhol a nyers teljesítmény mérésére koncentrálva...

MA 08:01

A kontextustömörítés végre élesben működik: 16x kevesebb input, veszteség nélkül

🚀 A modern nyelvi modellek számára egyre komolyabb kihívást jelent a kontextusablak mérete: ahogy egy MI-rendszer hosszabb ideig dolgozik, folyamatosan gyűlik a szöveg – például visszakeresett dokumentumok, érvelési láncok, beszélgetési előzmények formájában...

MA 07:45

A rizs rejtett ereje: okos anyaggá alakították a kutatók

Külön említést érdemel, hogy a rizs, amelyet szinte mindenki csak alapvető élelmiszerként ismer, valójában egészen szokatlan módon viselkedik nyomás hatására...

MA 07:37

A biztonsági vezetők tartanak az MI-től – még kézzel nézik a kódot

🔎 A mesterséges intelligencia (MI)-alapú kódolási segédeszközök valósággal letarolják a fejlesztőcsapatokat. A szoftverek hónapról hónapra gyorsabban készülnek, mint ahogy az ellenőrzésük képes lenne követni...