Olcsó MI-forradalom, egy titkos adatformátum mindent felforgat

Olcsó MI-forradalom, egy titkos adatformátum mindent felforgat
Az OpenAI új, nyílt súlyú modelljei körül sok a vita, de amit kevesen vesznek észre: az igazi forradalmat nem maguk a modellek, hanem az MXFP4 nevű, újszerű adatformátum hozza el. Ez a technológia drasztikusan csökkenti a futtatási (inferencia) költségeket, hatékonyabbá és mindenki számára elérhetőbbé teszi a mesterséges intelligenciát. Különösen fontos kiemelni, hogy ezzel a megoldással már negyedannyi hardveren is futhatnak ugyanazok a nyelvi modellek.

Mi is az az MXFP4?

Az MXFP4 egy 4 bites, lebegőpontos adattípus, amelyet az Open Compute Project definiált – ez a Facebook által 2011-ben indított közösségi kezdeményezés, amely az adatközponti komponenseket akarta olcsóbbá és hozzáférhetőbbé tenni. A névben az „MX” a mikroskálázásra utal: a sima FP4 kevés értéket tud ábrázolni (mindössze 16-ot), de az MXFP4 – okos matematikai trükkökkel – ezek helyett értékblokkokat tárol együttesen, közös skálázóval, így sokkal többet kihoz négy bitből.

Ez úgy működik, hogy a nagyobb pontosságú értékek blokkját (alapesetben 32 darabot) egy 8 bites számnak megfelelő közös szorzóval összevonják, és így kódolják vissza négybites szóként. A visszaalakításkor természetesen ezt a szorzót figyelembe kell venni, hogy a számok valódi értéke visszakerüljön.

Ugyanakkor a pontosság – bár messze jobb, mint a nyers FP4 esetén – így is némileg sérülhet, főleg ha veramente nagy méretű blokkokkal dolgozunk. Az újabb formátumok, például az NVFP4, kisebb, 16 elemű blokkokat és FP8-as skálázást alkalmaznak a pontosság további javításáért, de az alapelv azonos.

Fontos megjegyezni, hogy az MXFP4 mellett létezik MXFP6 és MXFP8 is, hasonló elvek alapján, csak eltérő bitszélességgel.

Milyen előnyei vannak az új adattípusnak?

A siker kulcsa a hely- és energiahatékonyság. Minél kisebbek a modellek súlyai, annál kevesebb VRAM, memóriabusz és számítási kapacitás kell a futtatásukhoz. A leggyakoribb, BF16 típusnál (ez 16 bites, lebegőpontos formátum) az MXFP4 alkalmazása kiemelkedő megtakarítást hoz: akár 75 százalékkal csökkenhetnek az erőforrásigények.

Az OpenAI beszámolója szerint a GPT-oss modellek 90 százalékán alkalmazták az MXFP4-es kvantálást. Ennek köszönhetően egy 120 milliárd paraméteres modell elfér egy 80 GB VRAM-os GPU-n, míg a 20 milliárdos verzió már akár 16 GB memórián is futhat.

Különösen fontos kiemelni, hogy az MXFP4-es modell nem csak negyedannyi helyet foglal, hanem akár négyszer gyorsabban is képes szöveget generálni, mint a BF16-ossal megegyező méretű társa. A tempót tovább fokozza, ha az adott hardver (például az Nvidia Blackwell szilícium) natív FP4 támogatással rendelkezik: ekkor akár kilenc petaFLOPS teljesítmény is kihozható egy B200 SXM modulból, szemben a BF16-tal mért 2,2 petaFLOPS-szal.

Ennek eredményeként a várakozási idő, amíg a modell elkészíti a válaszát, jelentősen lerövidül. Mindez úgy működik, hogy nem szükséges a natív FP4 támogatás – például az Nvidia H100-on (ahol nincs ilyen támogatás) is gond nélkül fut az MXFP4-ben kvantált modell, igaz, ott kisebb hatékonyság mellett.

Miért olyan nagy dolog ez az egész?

Bár a kvantálás nem új ötlet, sokan eddig kompromisszumnak tekintették a kisebb bitszélességet, mivel elkerülhetetlen bizonyos minőségvesztés. Ugyanakkor a kutatások szerint a 16-ról 8 bitre csökkentésnél ez a veszteség gyakorlatilag elhanyagolható a nagy nyelvi modelleknél, és egyre többen – például a DeepSeek – eleve FP8-ban tanítják modelljeiket.

Az MXFP4 sima FP4-hez képest hatalmas előrelépés, de nem csodaszer: az Nvidia szerint a minőség így is elmaradhat az FP8-tól, részben a blokkméret miatt. Az NVFP4 ezt próbálja kiküszöbölni, de a választás végső soron a felhasználók – vállalatok, API-szolgáltatók vagy felhőcégek – kezében van, hogy melyik verzió mellett döntenek.

Az OpenAI azonban most bevezette: a GPT-oss modelleket kizárólag MXFP4-ben adja ki. Nincs BF16 vagy FP8 változat. Ezzel – piacvezetőként – gyakorlatilag meghatározzák a szabványt, és azt sugallják mindenki másnak: ha nekünk elég jó az MXFP4, legyen elég jó nektek is.

Ennek következtében az infrastruktúra-szolgáltatók számára is könnyebbé válik a helyzet, hiszen a modellek jóval szerényebb hardverigénnyel is futtathatók – főleg, ha a hardver már támogatja az FP4-et. A felhőszolgáltatók ugyan kevésbé irányítják, ügyfeleik mivel töltik meg a bérletben adott hardvert, de minél többen választják az MXFP4-et, annál elterjedtebbé és olcsóbbá válik az egész MI-infrastruktúra.


A jövő: gyorsabb, olcsóbb, egyszerűbb MI mindenkinek

Az iparág most arra figyel, vajon az OpenAI riválisai is átveszik-e az MXFP4-et, vagy inkább saját változataikat vezetik be. Az biztos, hogy az MI-modellek futtatása új szintre lép: olcsóbban, gyorsabban, rugalmasabban lehet majd az eddiginél is nagyobb rendszereket működtetni. Az OpenAI lépése pedig mindenki számára kijelöli az irányt – akár tetszik, akár nem.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 15:18

A MI-vel felturbózott Windows 11 most mindenkit felbőszít – miért?

👨‍💻 Amit látunk, az túlmutat a megszokotton: a Windows 11 felhasználói folyamatosan egyre hangosabban fejezik ki elégedetlenségüket az operációs rendszer MI-vel kapcsolatos újításai miatt...

MA 15:03

A fosszilisenergia-létesítmények veszélybe sodorják az amerikaiak egészségét

Amerikában közel 47 millió ember él olyan közel valamilyen fosszilisenergia-infrastruktúrához, hogy mindennapjaik során jelentős egészségügyi kockázatoknak lehetnek kitéve...

MA 14:49

A milliárdos Jeff Bezos MI-re vált: új vállalat élén

Jeff Bezos új szerepben tér vissza: a Project Prometheus nevű MI-startup társigazgatója lesz...

MA 14:18

Az adatvédelem csődje: titkok, támadások, az elmaradt jelentés

Érdemes megvizsgálni, hogy az elmúlt hetekben hogyan sodródtak cégek és szervezetek súlyos adatbiztonsági botrányokba, miközben az állami szervek is késlekednek a nyilvánosság tájékoztatásával...

MA 13:33

Az önvezető autók San Franciscóban a macskákat is veszélyeztetik

A San Franciscó-i Mission negyed közösségét megrázta, hogy egy népszerű bolti macska, Kit Kat életét vesztette, amikor egy Waymo önvezető taxi elütötte október 27-én este...

MA 13:17

Az első Rivian-spinoff e-bike drága – de mire képes?

🚲 A Rivian elektromos járműgyártó egyik volt fejlesztőinek új cége, az Also bemutatta első saját e-bike-ját, a TM-B-t, amelynek alapmodellje várhatóan 1,25 millió forinttól (3 500 USD) indul...

MA 13:01

Az utolsó független zeneblog lázadása a mesterséges intelligencia ellen

🎶 Ha valaki indie rock-rajongó, biztosan ismeri a Stereogum nevét, amely már több mint húsz éve számít meghatározó zenei oldalnak...

MA 12:17

Az Amazon műholdas netje nevet váltott, az árak elszálltak

Az Amazon műholdas internethálózata mostantól egyszerűen Leo néven fut, ezzel véget ért a korábbi Project Kuiper időszak...

MA 12:01

Az Apple felborítja az iPhone-menetrendet: jön az iPhone Air?

Az Apple 2027 márciusára időzítheti az új iPhone Air megjelenését, amelyet rögtön az iPhone 18 és az iPhone 18e is követhet...

MA 11:49

Az új kriptokrach: elolvadt a Bitcoin idei nyeresége

Kevesebb mint másfél hónappal azután, hogy új történelmi rekordot döntött, a Bitcoin teljesen lenullázta idei 30%-os nyereségét...

MA 11:34

Az önéletrajz titka, amitől azonnal behívnak interjúra

📌 Különösen igaz ez akkor, ha egy jó önéletrajz egész karriert indíthat el, miközben egy átláthatatlan, rosszul szerkesztett dokumentum azonnal elveszítheti a döntéshozók figyelmét...

MA 11:17

Az űr az adatközpontok következő nagy dobása?

A technológiai nagyágyúk egyre komolyabban foglalkoznak azzal, hogy adatközpontokat építsenek a világűrben...

MA 10:58

Az elektronok vadonatúj állapota átírhatja a kvantumtechnológia szabályait

Az elektromosság mindennapjaink hajtóereje: autók, telefonok, számítógépek és szinte minden modern eszköz működésének alapja...

MA 10:41

Az afrikai pingvineket a halászat a kihalás szélére sodorja

🐧 Az afrikai pingvinek (Spheniscus demersus) drámai mértékben kiszorulnak természetes élőhelyeikről, mivel évről évre egyre erősebben versengenek a kereskedelmi halászhajókkal az élelemért...

MA 10:34

A hawaii gömbölyűfejű delfinek megőrülnek a tintahalért

A hawaii vizekben élő rövidszárnyú gömbölyűfejű delfinek (Globicephala macrorhynchus) hatalmas mennyiségű tintahalat fogyasztanak...

MA 10:26

A Princeton új kvantumchipje felforgatja a piacot

A Princeton Egyetem mérnökei háromszor stabilabb szupravezető qubitet alkottak, mint bármely korábbi típus, ezzel jelentősen közelebb hozva a valóban működőképes, megbízható kvantumszámítógépek korszakát...

MA 09:59

Az Intel elkaszálta a zászlóshajó Xeon szerverprocesszorokat

🛠 Megemlíthető továbbá, hogy az adatközponti piac rohamosan változik: az utóbbi hetekben az Intel új vezetés alatt alaposan átvizsgálta szerverprocesszor-útitervét, amely végül komoly irányváltáshoz vezetett...

MA 09:41

Az elektromos autók akkumulátorai áttörés előtt: itt az új korszak

Az LFP (lítium-vas-foszfát) akkumulátorok terjedése új lendületet kapott, miután 2022-ben lejártak a legfontosabb szabadalmak az alapkémiára...

MA 09:34

Az olasz fonalóriás is bedőlt: napvilágra kerültek a sztárdivat titkai

Fulgar, a H&M, az Adidas, a Wolford és a Calzedonia szintetikus fonalbeszállítója kénytelen elismerni, hogy zsarolóvírus-támadás érte, amelyet a hírhedt RansomHouse-csoporthoz kötnek...