2026. 03. 26., 06:44

A Google forradalmasítja az MI-memóriát: fele ár, nyolcszoros tempó

A Google forradalmasítja az MI-memóriát: fele ár, nyolcszoros tempó
A nagy nyelvi modellek fejlődése hatalmas dokumentumok és összetett beszélgetések feldolgozására teszi képessé az MI-t, de ezzel együtt egy komoly hardveres akadály, a kulcs–érték (KV) gyorsítótár szűk keresztmetszete is egyre nyilvánvalóbbá válik. Minden egyes szó, amivel egy modell dolgozik, egy bonyolult, nagy dimenziójú vektorként kerül eltárolásra a GPU-k VRAM-jában. Hosszú szövegek esetén ez a digitális „puskázólap” rohamtempóban gyarapodik, gyorsan felemészti az elérhető memóriát, egyre lassítva a feldolgozást.

Drasztikus áttörés: a TurboQuant algoritmus

A Google legújabb fejlesztése, a TurboQuant algoritmus most megoldja ezt az égető problémát: szoftveresen, matematikai úton teszi lehetővé a KV-gyorsítótár adatok extrém tömörítését, átlagosan hatszoros memóriaigény-csökkenéssel és akár nyolcszoros teljesítménynövekedéssel a figyelmi műveletek számításánál. Következésképpen a vállalatok, amelyek ezt bevezetik, több mint 50%-os költségmegtakarítást érhetnek el – és mindehhez nincs szükség új hardverre vagy drága hálózatokra.

A TurboQuant kódja és kutatási anyaga nyílt forráskódú, akár vállalati szinten is szabadon hozzáférhető. Ez azt jelenti, hogy külön tanítás vagy meglévő modellek újratanítása nélkül, azonnal alkalmazható.

Matek a memóriatárolás mögött: polár koordinátáktól az extrém tömörítésig

A hagyományos vektorkvantálás folyamata jelentős minőségromlással jár: amikor a precíz tizedesjegyekből egész számok lesznek, a felhalmozódó hibák miatt az MI gyakran „hallucinál”, vagy elveszíti szövegkövetési képességét. Ráadásul a legtöbb tömörítési eljárás kiegészítő konstansokat tárol minden blokkhoz, amelyek sokszor semmissé teszik a tömörítés előnyeit.

A TurboQuant újítása két szakaszból áll. Először a PolarQuant nevű technikát veti be, átalakítva a vektorokat polár koordinátákká, ahol minden adatpont egy sugárból és szögekből álló sorra bomlik. Ezután, egy véletlen rotációt követően a szögértékek eloszlása stabilizálódik, így már nincs szükség drága normalizáló adatok tárolására – minden blokk a fix körre illeszkedik.

Második lépésként a TurboQuant egy 1 bites Quantized Johnson–Lindenstrauss (QJL) transzformációval kezeli a maradék hibákat: minden értéket -1 vagy +1 jellé alakít. Így, amikor az MI kiszámítja, mely szavak a legfontosabbak (az úgynevezett figyelmi pontszám), a tömörített változat statisztikailag megegyezik az eredetivel.

Valódi tesztek, elképesztő eredmények

A TurboQuant hatékonysága kiemelkedő a „Tű a szénakazalban” (Needle-in-a-Haystack) kihíváson: képes tökéletes pontossággal megtalálni egyetlen mondatot százezer szóból álló szöveghalmazban is. Nyílt forráskódú modellekkel, mint a Llama-3.1-8B vagy a Mistral-7B, a TurboQuant hatszoros memóriaigény-csökkenés mellett is megőrzi a pontosságot, minőségromlás nélkül.

Következésképpen nemcsak chatbotokban, hanem nagy dimenziójú keresések során is áttörést hoz: a szemantikus keresés – ahol nem kulcsszavak, hanem jelentés szerinti vektorok alapján próbálunk tartalmakat párosítani – területén is felülmúl minden jelenlegi rivális módszert, miközben szinte nincs is szükség újraindexelésre.

Ezzel a módszerrel a valós idejű alkalmazások, például keresőmotorok, mostantól párhuzamosan, gyorsan és memóriatakarékosan futnak, akár NVIDIA H100 kártyákon is, amelyek nyolcszor gyorsabb figyelmi számítást tesznek lehetővé.


Őrült közösségi lelkesedés és gyors adaptáció

A bejelentést követően a szakmai közönség ujjongva, azonnal gyakorlati tesztekbe kezdett – mindössze 24 óra telt el, és a TurboQuant már különböző MI-könyvtárakban (például azokban, amelyek a Mac Minin vagy más fogyasztói eszközökön futnak) is működött. Egy technikai elemző például a Qwen3.5-35B modellt vizsgálta MLX környezetben, ahol 8,5K-tól 64K tokenig minden szintet tökéletes pontossággal vitt végig, a 2,5 bites változat pedig közel ötszörös gyorsítótár-csökkenést eredményezett minőségvesztés nélkül.

A közösség egyik legfontosabb üzenete: a TurboQuant a szabadon futtatható, otthoni MI és a drága felhős előfizetések közötti különbséget drasztikusan csökkenti. Mostantól bárki, akár egy egyszerű otthoni gépen is, képes 100 000 tokenes interakciókat futtatni érezhető lassulás és minőségcsökkenés nélkül – ráadásul biztonságosabban is, hiszen az adatokat nem kell kiadni harmadik félnek.

Piaci felfordulás: vége a végtelen memóriavásárlásnak?

Az újítás a tőzsdén is éreztette a hatását: a memóriaipari szereplők, például a Micron vagy a Western Digital részvényei erősen esni kezdtek. Ha ugyanis az MI-óriások szoftveresen a hatodára csökkentik a hardverigényüket, a High Bandwidth Memory (HBM) iránti falánk kereslet is mérséklődhet.

Ahogy haladunk előre 2026-ban, világossá válik: az MI fejlődésének következő hullámát nem a „minél nagyobb modellek”, hanem a „minél okosabb memória” határozza majd meg. A jelentősen olcsóbb MI-alapú szolgáltatások globálisan megdönthetik az eddigi költségstruktúrákat.

Mit tegyenek a vállalatok most?

Azok a cégek, amelyek már saját MI-modelleket futtatnak vagy treníroznak, most azonnali előnyhöz juthatnak: a TurboQuant használatához nem kell új adatokat gyűjteni vagy drága újratanítást végezni.

Gyakorlati lépések:

– A meglévő modellek memóriáját tömöríteni lehet, csökkentve a szükséges GPU-k számát és a felhős költségeket.
– Megnyúlnak a lehetséges „kontextusablakok”, vagyis sokkal hosszabb szöveggel képes dolgozni ugyanaz a rendszer.
– Adatvédelmi okokból az érzékeny MI-futtatások is könnyebbé válnak helyben, akár olyan eszközökön, amelyeken eddig ez technikailag lehetetlen volt.
– Mielőtt drága GPU-farmokat rendelne valaki, érdemes megnézni, mennyit old meg már önmagában ez a szoftveres trükk.

Végső soron a TurboQuant új fejezetet nyit az MI történetében: a jövő már nem a chipek számának növeléséről, hanem az információtárolás művészetéről szól – mindez a valós életben is azonnali eredményeket hoz.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 20:34

A Gothic Remake eladásai mutatják: még mindig imádjuk a eurojankot

Lényeges, hogy a 25 éves klasszikus szerepjáték újjáélesztett verziója, a Gothic Remake, elképesztő rajttal már egy hét alatt elérte az 500 000 eladott példányt...

MA 20:23

A Sonyt kár okolni: ex–Destiny 2 CM szerint a Bungie majdnem bezárt

A Destiny 2 rajongótábora most különösen nehéz időszakon megy keresztül: a játék az utóbbi időben gyakorlatilag parkolópályára került...

MA 20:12

Az amerikai kormány 2 milliárdot rátesz a kvantumszámításra, a védelem lemarad

💸 Az USA nem kevesebb mint 730 milliárd forintot fektet be a kvantumszámítógépek fejlesztésébe, miközben a másik oldalon, a védelem oldalán veszélyesen lelassult az innováció...

MA 19:56

A vb-házigazda Kanada Bosznia-Hercegovina ellen rajtol az első pontokért

Megemlíthető továbbá, hogy Toronto péntek este igazi futballünnepet ígér, hiszen a 2026-os labdarúgó-világbajnokság egyik házigazdája, Kanada Bosznia és Hercegovina ellen kezdi meg szereplését a B csoport nyitómeccsén...

MA 19:45

Az új SKYLRK Bluetooth-hangszórók, amiket a B&O is megirigyelne

🎧 Justin Bieber legújabb fejlesztéseivel rukkolt elő saját lifestyle márkája, a SKYLRK égisze alatt, ahol most két vadonatúj Bluetooth hangszóró és egy vezeték nélküli fejhallgató jelentek meg...

MA 19:34

A holland civil perelné a Valve-ot a magasan tartott árak miatt

💳 Évek óta a Steamre gondolva hatalmas leárazások, filléres játékhegyek és véget nem érő akciók jutnak eszünkbe, nem a magas árak...

MA 19:23

A Kalshi kriptós örökös határidős ügyletei újraélesztik a határidős–swap vitát

📈 Az amerikai pénzpiacokon újra fellángolt a vita: vajon hogyan is kellene szabályozni a kriptovaluta-befektetések egyik legnépszerűbb termékét, az örökös (perpetual) szerződést?..

MA 19:12

Az apró pórusok megváltoztathatják, hogyan tisztítja a világ a vizet

💧 Egészen új távlatok nyíltak meg az ipari víztisztítás és a vegyszerek leválasztásának jövőjében, miután kutatók egy hihetetlenül pontos, egy nanométeres pórusokkal rendelkező membránt fejlesztettek ki...

MA 19:01

A pénztárcabarát, pehelykönnyű pajzs: Norton Antivirus Plus teszt

Az online fenyegetések világában egyre fontosabb az okoseszközök gyors és zökkenőmentes védelme...

MA 18:57

A Tejútrendszer peremén a Kis Magellán-felhőt nagytestvére tépi szét

A Tejútrendszer peremén jelenleg is látványos dráma zajlik: a Kis Magellán-felhőt szó szerint szétszakítja nagyobb társa, a Nagy Magellán-felhő...

MA 18:47

A nép szava: a Resident Evil Veronica milliós kívánságlistát ér el

A Resident Evil Veronica bejelentése után szinte pillanatok alatt tarolt: kevesebb mint egy hét alatt egymillió kívánságlistára került PlayStation 5-ön és PC-n is...

MA 18:36

Az alaszkai gleccserek ijesztő válasza: három héttel hosszabb az olvadás

Felmerül a kérdés, hogy mennyire érzékenyek az alaszkai gleccserek a hőmérséklet-emelkedésre...

MA 18:26

A kivonások dacára a Bitcoin ETF-befektetők többsége kitart

Nehéz elhinni, de a Bitcoin ETF-ből már mintegy 3,27 billió forint értékű tőke távozott idén, mégsem omlott össze a piac...

MA 17:35

A Silent lapjai, amelyekkel Ascension 10-ig jutottam a Slay the Spire 2-ben

Az Ascension 10 teljesítése a Slay the Spire 2-ben nem tökéletes pakliépítésen múlik, hanem azon, hogy mennyire gyorsan és hatékonyan tudod megszüntetni a kezdőpaklid gyengeségeit...

MA 17:23

A legendás Rick James fia börtönben: Tazman Johnsont droggal vádolják

Rick James fia, Tazman Johnson jelenleg a Los Angeles megyei börtönben van, súlyos vádak miatt...

MA 16:45

A SpaceX tőzsdei rajtja: zuhanás vagy rakétázás a kriptónak?

🚀 Egy lényeges szempont, hogy hónapok várakozása után ma megkezdődik a SpaceX részvényének kereskedése a Nasdaqon, miután a befektetők 75 milliárd dollárt – azaz közel 27 000 milliárd forintot – öntöttek a valaha volt legnagyobb tőzsdei bevezetésbe...

MA 16:34

Az Arm AI-s sugárkövetéssel kihívja az AMD-t és az Intelt kézikonzolokban

Noha sokan csak a telefonjukról ismerik az Arm-chipeket, most kiderült, hogy ezek jóval többre is képesek...

MA 16:23

A Top Gun: Maverick színésze, James Handy halála: kés és fojtás

🔥 A 81 éves James Handy, akit a Top Gun: Maverick (Top Gun: Maverick) című filmben is láthattunk, brutális támadás áldozata lett Los Angeles-i otthonában...

MA 16:12

A Monero 33%-ot száguldott, 438 dollárig, 120 milliós blokkláncon zajló pénzmosás közepette

📈 A Monero árfolyama hirtelen 33%-ot ugrott, elérve a 438 dollár (kb...

MA 16:01

A Havn HS 360, a HS 420 kisebb, könnyebb és okosabb kistestvére

Az asztali számítógépházak világában sokan ismerhetik a masszív és látványos HS 420-at, amelynek most megérkezett a kisebb testvére...

MA 15:35

Az üvöltés lelassíthatja a szervereket: meghökkentő tény a HDD-kről

😱 Ez a jelenség jól illusztrálható azzal, hogy minden szerverteremben ott lapulnak a kis alumínium-, réz- és kerámiadobozkák, amelyek egészen emberi tulajdonságokat hordoznak – legalábbis amikor úgy viselkednek, mint egy sértődött munkatárs: ha rájuk ordítasz, lelassulnak...

MA 15:12

A Bitcoin 63 ezernél toporog: jön a bikák kálváriája?

📈 A hét elején látványos mélységbe, 59 000 dollárig zuhant le a bitcoin árfolyama, majd visszakapaszkodott 63 000 dollár környékére...

MA 15:01

Az új AirPods EQ már elérhető — még nem érdemes frissíteni

Az Apple végre elhozta az AirPods felhasználóinak az egyéni hangszínszabályzást (EQ-t), amire sokan régóta vártak...

MA 14:45

A Google erkölcsi iránytűje elveszett: vezető lemondott a Pentagon MI-szerződései miatt

A Google Android platformbiztonságáért felelős igazgatója, René Mayrhofer lemondott, miután a vállalat lehetővé tette, hogy az amerikai Védelmi Minisztérium (DoD) titkos feladatokra felhasználja a cég MI-modelljeit...

MA 14:23

A Seed lehet a The Sims óta a legnagyobb dobás

A Seed minden korábbi életszimulátor-játékot felülmúlhat, hiszen teljesen új távlatokat nyit meg a virtuális közösségek előtt...

MA 13:34

A BlackRock bitcoinjövedelem-ETF-je jövő héten rajtolhat

Érdemes megvizsgálni, hogy a BlackRock hamarosan új korszakot nyit a hagyományos pénzügyi piacokon, hiszen bemutatja a világ első olyan bitcoin ETF-jét, amely kifejezetten jövedelemtermelésre fókuszál...

MA 13:23

Így nézheted élőben: Barcelona–Catalunya Nagydíj 2026 – menetrend, előzetes

🏁 Fontos kérdés, ki lesz képes villantani a 2026-os F1-es szezon következő, fordulatos futamán Barcelonában, ahol a történelmi pálya idén először viseli a Barcelona-Catalunya Nagydíj elnevezést...

MA 13:01

A Metaplanet felvásárolja a Siiibo Securities-t: gyorsul a bitcoin-forradalom

🚀 Érdemes megvizsgálni, hogy egy friss japán felvásárlással a Metaplanet jelentős lépést tett a digitális pénzügyi rendszer átalakítása felé...

MA 12:56

Az MI forradalmasítja a számlacsalás elleni küzdelmet

A mesterséges intelligencia (MI) néhány év alatt gyökeresen átalakította a vállalatok mindennapjait, és különösen a pénzügyi csapatok működésében hozott jelentős változásokat...