MA 06:44

A Google forradalmasítja az MI-memóriát: fele ár, nyolcszoros tempó

A Google forradalmasítja az MI-memóriát: fele ár, nyolcszoros tempó
A nagy nyelvi modellek fejlődése hatalmas dokumentumok és összetett beszélgetések feldolgozására teszi képessé az MI-t, de ezzel együtt egy komoly hardveres akadály, a kulcs–érték (KV) gyorsítótár szűk keresztmetszete is egyre nyilvánvalóbbá válik. Minden egyes szó, amivel egy modell dolgozik, egy bonyolult, nagy dimenziójú vektorként kerül eltárolásra a GPU-k VRAM-jában. Hosszú szövegek esetén ez a digitális „puskázólap” rohamtempóban gyarapodik, gyorsan felemészti az elérhető memóriát, egyre lassítva a feldolgozást.

Drasztikus áttörés: a TurboQuant algoritmus

A Google legújabb fejlesztése, a TurboQuant algoritmus most megoldja ezt az égető problémát: szoftveresen, matematikai úton teszi lehetővé a KV-gyorsítótár adatok extrém tömörítését, átlagosan hatszoros memóriaigény-csökkenéssel és akár nyolcszoros teljesítménynövekedéssel a figyelmi műveletek számításánál. Következésképpen a vállalatok, amelyek ezt bevezetik, több mint 50%-os költségmegtakarítást érhetnek el – és mindehhez nincs szükség új hardverre vagy drága hálózatokra.

A TurboQuant kódja és kutatási anyaga nyílt forráskódú, akár vállalati szinten is szabadon hozzáférhető. Ez azt jelenti, hogy külön tanítás vagy meglévő modellek újratanítása nélkül, azonnal alkalmazható.

Matek a memóriatárolás mögött: polár koordinátáktól az extrém tömörítésig

A hagyományos vektorkvantálás folyamata jelentős minőségromlással jár: amikor a precíz tizedesjegyekből egész számok lesznek, a felhalmozódó hibák miatt az MI gyakran „hallucinál”, vagy elveszíti szövegkövetési képességét. Ráadásul a legtöbb tömörítési eljárás kiegészítő konstansokat tárol minden blokkhoz, amelyek sokszor semmissé teszik a tömörítés előnyeit.

A TurboQuant újítása két szakaszból áll. Először a PolarQuant nevű technikát veti be, átalakítva a vektorokat polár koordinátákká, ahol minden adatpont egy sugárból és szögekből álló sorra bomlik. Ezután, egy véletlen rotációt követően a szögértékek eloszlása stabilizálódik, így már nincs szükség drága normalizáló adatok tárolására – minden blokk a fix körre illeszkedik.

Második lépésként a TurboQuant egy 1 bites Quantized Johnson–Lindenstrauss (QJL) transzformációval kezeli a maradék hibákat: minden értéket -1 vagy +1 jellé alakít. Így, amikor az MI kiszámítja, mely szavak a legfontosabbak (az úgynevezett figyelmi pontszám), a tömörített változat statisztikailag megegyezik az eredetivel.

Valódi tesztek, elképesztő eredmények

A TurboQuant hatékonysága kiemelkedő a „Tű a szénakazalban” (Needle-in-a-Haystack) kihíváson: képes tökéletes pontossággal megtalálni egyetlen mondatot százezer szóból álló szöveghalmazban is. Nyílt forráskódú modellekkel, mint a Llama-3.1-8B vagy a Mistral-7B, a TurboQuant hatszoros memóriaigény-csökkenés mellett is megőrzi a pontosságot, minőségromlás nélkül.

Következésképpen nemcsak chatbotokban, hanem nagy dimenziójú keresések során is áttörést hoz: a szemantikus keresés – ahol nem kulcsszavak, hanem jelentés szerinti vektorok alapján próbálunk tartalmakat párosítani – területén is felülmúl minden jelenlegi rivális módszert, miközben szinte nincs is szükség újraindexelésre.

Ezzel a módszerrel a valós idejű alkalmazások, például keresőmotorok, mostantól párhuzamosan, gyorsan és memóriatakarékosan futnak, akár NVIDIA H100 kártyákon is, amelyek nyolcszor gyorsabb figyelmi számítást tesznek lehetővé.


Őrült közösségi lelkesedés és gyors adaptáció

A bejelentést követően a szakmai közönség ujjongva, azonnal gyakorlati tesztekbe kezdett – mindössze 24 óra telt el, és a TurboQuant már különböző MI-könyvtárakban (például azokban, amelyek a Mac Minin vagy más fogyasztói eszközökön futnak) is működött. Egy technikai elemző például a Qwen3.5-35B modellt vizsgálta MLX környezetben, ahol 8,5K-tól 64K tokenig minden szintet tökéletes pontossággal vitt végig, a 2,5 bites változat pedig közel ötszörös gyorsítótár-csökkenést eredményezett minőségvesztés nélkül.

A közösség egyik legfontosabb üzenete: a TurboQuant a szabadon futtatható, otthoni MI és a drága felhős előfizetések közötti különbséget drasztikusan csökkenti. Mostantól bárki, akár egy egyszerű otthoni gépen is, képes 100 000 tokenes interakciókat futtatni érezhető lassulás és minőségcsökkenés nélkül – ráadásul biztonságosabban is, hiszen az adatokat nem kell kiadni harmadik félnek.

Piaci felfordulás: vége a végtelen memóriavásárlásnak?

Az újítás a tőzsdén is éreztette a hatását: a memóriaipari szereplők, például a Micron vagy a Western Digital részvényei erősen esni kezdtek. Ha ugyanis az MI-óriások szoftveresen a hatodára csökkentik a hardverigényüket, a High Bandwidth Memory (HBM) iránti falánk kereslet is mérséklődhet.

Ahogy haladunk előre 2026-ban, világossá válik: az MI fejlődésének következő hullámát nem a „minél nagyobb modellek”, hanem a „minél okosabb memória” határozza majd meg. A jelentősen olcsóbb MI-alapú szolgáltatások globálisan megdönthetik az eddigi költségstruktúrákat.

Mit tegyenek a vállalatok most?

Azok a cégek, amelyek már saját MI-modelleket futtatnak vagy treníroznak, most azonnali előnyhöz juthatnak: a TurboQuant használatához nem kell új adatokat gyűjteni vagy drága újratanítást végezni.

Gyakorlati lépések:

– A meglévő modellek memóriáját tömöríteni lehet, csökkentve a szükséges GPU-k számát és a felhős költségeket.
– Megnyúlnak a lehetséges „kontextusablakok”, vagyis sokkal hosszabb szöveggel képes dolgozni ugyanaz a rendszer.
– Adatvédelmi okokból az érzékeny MI-futtatások is könnyebbé válnak helyben, akár olyan eszközökön, amelyeken eddig ez technikailag lehetetlen volt.
– Mielőtt drága GPU-farmokat rendelne valaki, érdemes megnézni, mennyit old meg már önmagában ez a szoftveres trükk.

Végső soron a TurboQuant új fejezetet nyit az MI történetében: a jövő már nem a chipek számának növeléséről, hanem az információtárolás művészetéről szól – mindez a valós életben is azonnali eredményeket hoz.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 07:57

Az új tömegspektrométer egyszerre milliárdnyi molekula titkát fedi fel

🔬 Az elmúlt évtizedekben a tömegspektrometria alapvető eszközzé vált a tudományos kutatásban, ám a technika egyik legnagyobb korlátja, hogy a legtöbb jelenleg használt műszer egyszerre csak néhány molekulát képes elemezni...

MA 07:50

Az MI‑ellátási lánc új réme: hamis papírral is támadnak

🛑 A szoftverellátási lánc sebezhetőségei eddig főként kártevők és zsarolóvírusok révén kerültek be a köztudatba, azonban most egy lényegesen egyszerűbb módszer is elérhetővé vált a támadóknak: rosszindulatú vagy hamisított API-dokumentációval is megvezethetők az MI-alapú kódoló ügynökök...

MA 07:36

Az amerikai tél halálos ára: évente 40 ezer infarktus

Az USA-ban a zimankós hónapok alatt ugrásszerűen megnő a szív- és érrendszeri halálozások száma...

MA 07:22

Az MI-s Bubble-alkalmazások új húzása: tömeges Microsoft-fióklopás

A bűnözők legújabb trükkje, hogy a Bubble nevű, no-code, MI-alapú alkalmazáskészítő platformot használják Microsoft-fiókok elleni adathalász támadásokhoz...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:08

A Reddit az emberekért küzd: jön az emberazonosítás

👤 A Reddit új lépést tett a gyanús aktivitás kiszűrésére: hamarosan arra kötelezi azokat a fiókokat, amelyek automatizált vagy egyébként gépies viselkedést mutatnak, hogy igazolják, valóban ember kezeli őket...

MA 07:01

A mesterséges intelligencia már a GitHub védőernyője alatt működik

A GitHub mostantól mesterséges intelligenciát vet be hibák és sebezhetőségek felderítésére, ezzel jóval szélesebb biztonsági lefedettséget ígér...

MA 06:50

A rejtélyes új-zélandi barlang felfedi a múlt titkait

🗿 Egy váratlanul gazdag lelet került elő egy észak-új-zélandi barlang mélyéből: mintegy egymillió éves fosszíliák, amelyek között tucatnyi madárfaj és négy különböző béka is szerepel...

MA 06:36

A Lyria 3 Pro megérkezett: háromperces dalokat ír helyetted

🎵 Zenei ötletekből mostantól kész dalok születhetnek mindössze néhány pillanat alatt. A Gemini alkalmazás fizetős előfizetői számára most elérhető a Lyria 3 Pro, amely már háromperces zeneszámok generálására is képes...

MA 06:29

Az erősebb földi mágneses pajzs a Holdat is megóvná?

Fontos kérdés, hogy pontosan meddig terjed ki Földünk védelmező ereje az űrben...

MA 06:21

Az új Szaturnusz-fotók minden várakozást felülmúlnak

A legújabb felvételeken két korszak zászlóshajói, a James Webb- és a Hubble-űrteleszkóp egyszerre fürkészik a Szaturnusz légkörét...

MA 06:15

Az okos robotbírók lerombolják a baseball-mítoszt – tetszik vagy sem

⚽ Számíthatsz rá, hogy a 2026-os Major League Baseball-szezon jócskán hoz majd újdonságokat...

MA 06:05

Történelmi események a mai napon (Március 26.)

Mi történt ezen a napon a történelemben? Viharos hatalomváltások, forradalmi csaták és világrengető döntések formálták ezt a napot a történelemben...

szerda 21:56

Az Apple II most MS-DOS-t futtat – kapaszkodj!

💻 Képzeld el az Apple II-t, amelyben valaki nem törődött bele az idő vasfogának munkájába, és összebarkácsolta a lehetetlent: új életet lehelt az AD8088 koprocesszor-kártyába, így az öreg gép MS-DOS 2...

szerda 21:45

A rejtőzködő fehér törpe leplezte le a csillag titkát

Nincs még egy olyan szabad szemmel is látható csillag, mint a Cassiopeia csillagképben ragyogó Gamma Cassiopeiae, amely csaknem ötven éve zavarba ejti a kutatókat...

szerda 21:34

A Pinterest forradalma: végre az inspiráció a főszerepben

A Pinterest vezére, Bill Ready most nekiment annak a mélyen gyökerező hisztériának, amelyet a legtöbb közösségi oldal szinte az anyatejjel szívja magába...

szerda 21:26

Az Apple bekeményít: szigorúbb korhatárellenőrzés, új szabályok érkeznek

Különösen igaz, ha iPhone-t használsz az Egyesült Királyságban: a legújabb iOS-frissítéssel milliókat kérnek arra, hogy igazolják, betöltötték a 18...

szerda 21:01

A Meta újabb leépítései keményen sújtják a dolgozókat

A Meta ismét több száz dolgozót bocsátott el, ezúttal főként a Reality Labs részlegből, amely a cég VR- és metaverzum-projektjeit irányítja...

szerda 20:57

A vörös bolygó rubinokat és zafírokat rejthet – az élet nyomait?

A Mars felszíne apró, drágakőhöz hasonló kristályokat rejt, többek között rubinokat és talán még zafírokat is...

szerda 20:47

A metaverzum sírba szállt – bukás vagy nagy visszatérés?

Az elmúlt évek egyik legnagyobb technológiai ígérete, a metaverzum fejlesztése és a körülötte kialakult felhajtás mára szinte teljesen elhalt...

szerda 20:35

Az űr következő nagy dobása: NASA-holdbázis és nukleáris űrhajó érkeznek

🚀 Érdemes megvizsgálni, hogy a NASA soha nem látott ambíciókkal és elképesztő tempóban készül átalakítani a következő évtized űrkutatását...

szerda 20:23

Az antianyag kamionra szállt – az év tudományos kalandja

🚗 A CERN kutatói először vitték ki az antianyagot a laboratóriumból, és ezzel egy kamionnyi, pontosan 92 antiproton szállítására alkalmas csúcstechnológiás csapdát gördítettek végig a kutatóközpont területén...

szerda 20:13

Az alvilág új kedvence: az MI-fiók

Az utóbbi időben a mesterséges intelligencia (MI) eszközök gyorsan beépültek a mindennapokba, legyen szó tartalomgyártásról, szoftverfejlesztésről vagy éppen üzleti folyamatokról...

szerda 20:01

Az OpenAI Sora-fiaskója miatt bukott a Disney milliárdos üzlete

A Disney váratlanul visszavonult az OpenAI-jal kötött tervezett, 1 milliárd dolláros (kb...

szerda 19:56

Az elektromos motorokat tényleg ijesztően könnyű feltörni?

⚠ Az elektromos motorokat gyártó Zero Motorcycles azt hirdette, hogy járműveik feltörhetetlenek – végül kiderült, hogy óriásit tévedtek...

szerda 19:45

Az Android rakétára kapcsolt: ő lett a mobilnet királya

Elképesztő tempót diktál mostanában az Android, ha mobilos böngészésről van szó...

szerda 19:34

Az új Citrix-sebezhetőségek: frissítés nélkül célponttá válsz

Két súlyos sérülékenységre derült fény a NetScaler ADC és NetScaler Gateway eszközökben...

szerda 19:23

Az első nagy per a közösségi média ellen: bajban a techóriások

A Los Angeles-i esküdtszék történelmi döntést hozott: a Meta és a YouTube jelentősen felelősek egy fiatalkorú közösségi média-függőségéért...

szerda 18:01

Az MI pénzgyára dübörög: érkeznek az Arm titkos, izgalmas processzorai

💸 Az Arm vezérigazgatója, René Haas új irányba fordítja az eddig főleg IP-licenceléstől függő brit chipfejlesztő vállalatot...