MA 08:01

A kontextustömörítés végre élesben működik: 16x kevesebb input, veszteség nélkül

A kontextustömörítés végre élesben működik: 16x kevesebb input, veszteség nélkül
A modern nyelvi modellek számára egyre komolyabb kihívást jelent a kontextusablak mérete: ahogy egy MI-rendszer hosszabb ideig dolgozik, folyamatosan gyűlik a szöveg – például visszakeresett dokumentumok, érvelési láncok, beszélgetési előzmények formájában. Ezek feldolgozása rengeteg memóriát és számítási kapacitást igényel, így a kontextus folyamatos növekedése az egyik legnagyobb akadállyá lépett elő a további fejlődés előtt. Eddig a legtöbb kontextustömörítő módszer vagy túl nagy pontosságvesztéssel járt, vagy bonyolult, lassú utólagos tömörítést használt, ami alig eredményezett valódi gyorsulást – így termelési környezetben alig volt használható.

Új irány: tömörítés dekódolás előtt

Hat egyetem – többek közt a NYU, a Columbia, a Princeton, a University of Maryland, a Harvard, valamint a Lawrence Livermore National Laboratory – kutatói most egy radikálisan új megközelítést dolgoztak ki. Az általuk bemutatott Latent Context Language Models (LCLM) olyan kódoló–dekódoló elvek alapján tömörít, hogy a bemeneti szöveget jóval a dekódolás előtt rövidíti le. A nyílt forráskódú modellek letölthetők a Hugging Face platformon.

A legtöbb korábbi módszer – például az elterjedt KV cache tömörítés – úgy működik, hogy minden szöveget teljes egészében feldolgoz, majd az adatokat kezdi el szelektálni. Ezzel szemben az LCLM azonnal megszabadul a fölösleges részek túlnyomó többségétől, már mielőtt a dekóderhez eljutnának. Ennek következtében akár 16-szoros tömörítésnél 8,8-szoros gyorsulást értek el a RULER hosszú kontextusú benchmarkon, miközben a pontosságcsökkenés minimális maradt.

Alapos tesztelés, apró veszteségek

Az LCLM lehetővé teszi, hogy a modellek a korábbinál sokkal hosszabb szövegrészleteket is értelmezni tudjanak – jóval kevesebb memória- és számítási igény mellett, ráadásul a minőségen sem esik nagy csorba. Negyedelés, azaz négyszeres tömörítés során 91,76%-os pontosságot mértek, míg a tömörítetlen alapmodell 94,41%-ot tudott: kevesebb mint 3%-os esés úgy, hogy a szöveg háromnegyedét elhagyják. Még extrém, 16-szoros tömörítésnél is a pontosság 75%-on maradt. Összehasonlításképp: ilyen mértékű tömörítésnél minden versenytárs elvérzett, még a KV cache stratégiák is. Ráadásul rövidebb szövegeken – például a GSM8K feladatoknál – szintén messze a legjobban teljesített.

A modell felépítése és tanítása

A fejlesztők egy 600 millió paraméteres kódolót társítottak egy 4 milliárd paraméteres dekóderhez. A kódoló a bevitt szöveget rövid, sűrített rejtett reprezentációk sorozatára tömöríti, ezt elemzi ki a dekóder. Tanítás közben 350 milliárd tokennel dolgoztak, három adatforrással: folyamatos előtanulás vegyítve tömörített és eredeti szövegekkel, speciális finomhangolás logikai és hosszú szöveges feladatokra, illetve egy segédfeladaton keresztül azt is támogatták, hogy a tömörítés közben a részletek se vesszenek el.

A kutatási eredményekből az is látszik, hogy a dekóder mérete jobban befolyásolja a teljesítményt, mint a kódolóé.


Gyakorlatban is működik

Az LCLM nem elméleti játékszer: a mindennapi MI-pipeline-okba simán beilleszthető, egyszerűen lecserélhető vele bármelyik meglévő nagy nyelvi modell. Leginkább akkor hoz óriási előnyt, amikor nagy dokumentumhalmazokat vagy sok, külső forrásból összegyűjtött információt kell gyorsan, költséghatékonyan feldolgozni.

Ebből arra lehet következtetni, hogy a jövőben egy MI-modell képes lesz hatalmas adathalmazokban is gyorsan átfutni, és csak a legfontosabb részletekbe mélyed bele – pont, mint amikor egy ember átpörget egy könyvet, majd ott áll meg, ahol tényleg érdekes információt talál.

Az üzleti szférában is érezhető a robbanás: a kontextuskezelés fejlesztésére irányuló beruházások három hónap alatt a háromszorosára nőttek, márciusra első számú prioritássá léptek elő.

Hova tovább?

Három fő tanulság vonható le a vállalati alkalmazás szempontjából. Először is: a költségek egyértelműen a szövegmennyiséggel arányosan nőnek. Ha például egymillió token nagyságrendű bemenetet szeretnénk feldolgozni, a hagyományos, tömörítés nélküli technika egy NVIDIA H200 GPU memóriakorlátaiba ütközik, míg az LCLM bőven határon belül marad. Másodszor: az adatgyűjtő (RAG) pipeline-ok további finomhangolást igényelnek, mivel a tömörítési arány a visszakeresési pontosságra is hatással lehet. Harmadszor: az érvelési láncok tömörítése jelenleg még nyitott terület – ennek fejlesztésén még dolgoznak a kutatók.

Az LCLM-modellek már elérhetők a Hugging Face portálon, a kód pedig a GitHubon is szabadon böngészhető.
Ennek következtében az MI-k számára egyre kevésbé lesz határ a feldolgozható szövegmennyiség – az emberi gondolkodáshoz hasonlóan most már száguldhatnak végig gigászi dokumentumhalmokon is.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 10:46

Az ICC női T20-vb 2026: így nézheted ingyen, menetrend, csapatok

🏏 A világ tizenkét legjobb női krikettcsapata idén nyáron, június 12. és július 5...

MA 10:37

A SpaceX kriptotőzsdei IPO-ja újra szárnyal: 2,4 billió dollár.

🚀 A SpaceX nevét viselő, blokklánc-alapú és kriptotőzsdén elérhető örökös szerződés (SPCX) jelentős fordulatot vett a hét végére...

MA 10:28

Miért nem engednek kiszállni a mechből? Öt év az ára.

A mech-játékok kedvelői általában arra vágynak, hogy necsak monumentális gépeikkel harcolhassanak, hanem ki is szállhassanak a pilótafülkéből, és felfedezhessék a világot emberként is...

MA 10:19

Az El Niño itt van: a valaha mért legerősebbek között

🌞 Az El Niño éghajlati jelenség hivatalosan megérkezett, és minden jel arra utal, hogy idén a történelem egyik legerősebbje lesz...

MA 09:55

A Coinbase MI-ügynökei már helyetted kereskednek és költenek

💰 A Coinbase új korszakot nyitott a digitális pénzügyekben: az úgynevezett „Coinbase for Agents” platformon keresztül intelligens asszisztensek, mint a ChatGPT vagy a Claude, mostantól képesek összekapcsolódni a felhasználók számláival, hogy kriptopénzzel kereskedjenek, adatokhoz férjenek hozzá, sőt, hamarosan önállóan fizessenek és vásároljanak is...

MA 09:46

Az örök fagy mókusürüléke mamutok, bölények, lovak és nagymacskák DNS-ét rejti

🦜 Érdekes felvetés, hogy néhány fagyott mókusürülék mennyire képes feltárni a hajdani élővilág gazdagságát...

MA 09:37

A Tejút visszatér: így készíts lélegzetelállító nyári fotókat

Ilyen eset például, amikor a nyári napforduló elhozza a késő esti égbolt varázsát: júniusban a Tejút legfényesebb, legszebb részét láthatjuk az északi féltekéről...

MA 09:27

Az LG a blokkláncra viszi a reklámokat – az Arbitrum segít

Ilyen eset például, amikor egy világcég a hagyományos reklámozás helyett teljesen új megközelítést választ...

MA 09:19

A SpaceX minden idők legnagyobb tőzsdei kibocsátásával rekordot döntött

🚀 Elon Musk űripari vállalata, a SpaceX történelmi léptékű tőzsdei bevezetést hajtott végre: részvényeit 135 dolláros (kb...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/12

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     CrestWall – 4K Wallpapers (iPhone/iPad)A CrestWall egy gondosan válogatott, 4K felbontású háttérképeket kínáló alkalmazás, amelyet azoknak terveztek, akik fontosnak tartják iPhone-juk megjelenését...

MA 09:10

A britek fele egy csapásra tüntetné el az MI-t – főleg a fiatalok

🚀 Majdnem minden második brit felnőtt szívesen eltüntetné a generatív MI-t, ha tehetné...

MA 09:01

A TWID-ek búcsúznak: vége egy korszaknak a Destiny 2-ben

A Destiny 2-rajongók számára most egy korszak zárul le. A játék nemrég megkapta A Diadal Emlékműve (Monument of Triumph) frissítését, amely nagyjából lezárja a Destiny 2 hivatalos fejlesztéseit...

MA 08:55

Az akkumulátormentes eszköz a napfényt üzemanyaggá alakítja

Napfényből, vízből és szén-dioxidból üzemanyagot előállítani hosszú ideje a tudósok egyik legnagyobb álma...

MA 08:46

Az erőnléti edzés arany középútja a hosszabb élethez

💪 Érdemes megérteni, hogy napjainkban sokan keresik a hosszú élet kulcsát, de csak kevesen gondolnak arra, hogy a súlyzók vagy a saját testsúlyos edzés valódi aranybányát rejtenek...

MA 08:37

A Microsoft nyílt forrású SkillOptja súlyokhoz nyúlás nélkül turbózza az MI-ügynököket

🧠 A modern MI-ügynökök számtalan vállalati területen dolgoznak: összetett munkafolyamatokat hangolnak össze, segítenek adatokat elemezni és a mindennapi folyamatokat automatizálni...

MA 08:28

Az iOS 27 21 újdonsága, amire nem jutott idő a 2026-os WWDC-n

📶 Az iOS 27 nemcsak a megújult Siri MI-jétől lesz izgalmas, hanem olyan rejtett vagy kevésbé említett frissítésektől is, amelyek igazi örömet szerezhetnek az iPhone-felhasználóknak...

MA 08:19

Az MI-tesztek mit nem árulnak el a valós teljesítményről?

🤔 Ilyen eset például, amikor cégek hosszú hónapokat töltenek számítási kapacitás kiépítésével, GPU-k beszerzésével, felhőkörnyezet kialakításával, mindenhol a nyers teljesítmény mérésére koncentrálva...

MA 07:45

A rizs rejtett ereje: okos anyaggá alakították a kutatók

Külön említést érdemel, hogy a rizs, amelyet szinte mindenki csak alapvető élelmiszerként ismer, valójában egészen szokatlan módon viselkedik nyomás hatására...

MA 07:37

A biztonsági vezetők tartanak az MI-től – még kézzel nézik a kódot

🔎 A mesterséges intelligencia (MI)-alapú kódolási segédeszközök valósággal letarolják a fejlesztőcsapatokat. A szoftverek hónapról hónapra gyorsabban készülnek, mint ahogy az ellenőrzésük képes lenne követni...

MA 07:28

A C-vitamin megóvhatja az öregedő agyat? Új bizonyíték

A C-vitaminról a legtöbbeknek a megfázás elleni védekezés jut eszébe, pedig egy most megjelent, nagyszabású japán kutatás szerint sokkal nagyobb szerepet játszhat idősödő agyunk egészségének megőrzésében, mint gondolnánk...

MA 07:10

A Föld óriási földalatti gombahálózata a Tejútrendszer tizedét is lefedné, térkép szerint

A Föld legrejtettebb, de egyik legnagyobb élő birodalma a talaj alatt húzódik — a gombafonalak elképesztő szövedéke...

MA 07:01

Az Artemis III legénysége az egyik legösszetettebb űrküldetésre készül

Az Artemis III küldetése mérföldkő lesz az emberes űrrepülés történetében: a NASA hivatalosan is bemutatta azt a négy űrhajóst, akik 2027-ben indulnak útnak, és egy tartalék asztronautát is kijelöltek...

MA 06:55

A halálos galandféreg elérte az USA északnyugati partvidékét

Észak-Amerika vadonja újabb veszélyforrással szembesül: egy olyan parazita jelent meg a Csendes-óceán északnyugati partvidékének rókaféléiben, amely halálos, daganatszerű cisztákat okozhat emberekben és háziállatokban...

MA 06:46

Az újabb kriptokrach után – mi jön most?

Májusban jelentős forráskivonásokat szenvedtek el a globális kriptós ETF-ek, ez pedig a korábbi növekedést visszafordította...

MA 06:37

Az 1100 éves montanai bölényvadászhely rejtélye végre megoldódott

🩺 Több ezer évig a bölények uralták Észak-Amerika nagy síkságait, és a helyi őslakos vadászok számára nélkülözhetetlen erőforrásnak számítottak...

MA 06:28

A Fable árnyalt hírneve arannyal simán megkerülhető

💵 Felmerül a kérdés, hogy mennyit is érnek a tettek egy világban, ahol némi arannyal bárki átírhatja a múltját...

MA 06:19

Az európai bankok túllépnek az „egy nagy stabilcoin” illúzióján

A bankvilágban hatalmas átalakulás zajlik: a korábbi versengés a mindent vivő stabilcoinért elhalványul, a hangsúly inkább a különféle tokenizált pénzügyi eszközök összehangolt rendszerére helyeződik át...

MA 06:05

Történelmi események a mai napon (Június 12.)

Válogatás a történelem mai napjának fordulópontjaiból: a magyarok augsburgi győzelme, Anne Frank naplójának első napja, Reagan ikonikus berlini beszéde és az orlandói merénylet tragédiája...

csütörtök 18:02

A SpaceX tőzsdére készül: 2 billiós értéket jósol a kriptópiac

🚀 Elon Musk cége, a SpaceX a tőzsdére lépés küszöbén áll, a részvények kereskedése holnap indul a Nasdaqon...