MA 08:01

A kontextustömörítés végre élesben működik: 16x kevesebb input, veszteség nélkül

A kontextustömörítés végre élesben működik: 16x kevesebb input, veszteség nélkül
A modern nyelvi modellek számára egyre komolyabb kihívást jelent a kontextusablak mérete: ahogy egy MI-rendszer hosszabb ideig dolgozik, folyamatosan gyűlik a szöveg – például visszakeresett dokumentumok, érvelési láncok, beszélgetési előzmények formájában. Ezek feldolgozása rengeteg memóriát és számítási kapacitást igényel, így a kontextus folyamatos növekedése az egyik legnagyobb akadállyá lépett elő a további fejlődés előtt. Eddig a legtöbb kontextustömörítő módszer vagy túl nagy pontosságvesztéssel járt, vagy bonyolult, lassú utólagos tömörítést használt, ami alig eredményezett valódi gyorsulást – így termelési környezetben alig volt használható.

Új irány: tömörítés dekódolás előtt

Hat egyetem – többek közt a NYU, a Columbia, a Princeton, a University of Maryland, a Harvard, valamint a Lawrence Livermore National Laboratory – kutatói most egy radikálisan új megközelítést dolgoztak ki. Az általuk bemutatott Latent Context Language Models (LCLM) olyan kódoló–dekódoló elvek alapján tömörít, hogy a bemeneti szöveget jóval a dekódolás előtt rövidíti le. A nyílt forráskódú modellek letölthetők a Hugging Face platformon.

A legtöbb korábbi módszer – például az elterjedt KV cache tömörítés – úgy működik, hogy minden szöveget teljes egészében feldolgoz, majd az adatokat kezdi el szelektálni. Ezzel szemben az LCLM azonnal megszabadul a fölösleges részek túlnyomó többségétől, már mielőtt a dekóderhez eljutnának. Ennek következtében akár 16-szoros tömörítésnél 8,8-szoros gyorsulást értek el a RULER hosszú kontextusú benchmarkon, miközben a pontosságcsökkenés minimális maradt.

Alapos tesztelés, apró veszteségek

Az LCLM lehetővé teszi, hogy a modellek a korábbinál sokkal hosszabb szövegrészleteket is értelmezni tudjanak – jóval kevesebb memória- és számítási igény mellett, ráadásul a minőségen sem esik nagy csorba. Negyedelés, azaz négyszeres tömörítés során 91,76%-os pontosságot mértek, míg a tömörítetlen alapmodell 94,41%-ot tudott: kevesebb mint 3%-os esés úgy, hogy a szöveg háromnegyedét elhagyják. Még extrém, 16-szoros tömörítésnél is a pontosság 75%-on maradt. Összehasonlításképp: ilyen mértékű tömörítésnél minden versenytárs elvérzett, még a KV cache stratégiák is. Ráadásul rövidebb szövegeken – például a GSM8K feladatoknál – szintén messze a legjobban teljesített.

A modell felépítése és tanítása

A fejlesztők egy 600 millió paraméteres kódolót társítottak egy 4 milliárd paraméteres dekóderhez. A kódoló a bevitt szöveget rövid, sűrített rejtett reprezentációk sorozatára tömöríti, ezt elemzi ki a dekóder. Tanítás közben 350 milliárd tokennel dolgoztak, három adatforrással: folyamatos előtanulás vegyítve tömörített és eredeti szövegekkel, speciális finomhangolás logikai és hosszú szöveges feladatokra, illetve egy segédfeladaton keresztül azt is támogatták, hogy a tömörítés közben a részletek se vesszenek el.

A kutatási eredményekből az is látszik, hogy a dekóder mérete jobban befolyásolja a teljesítményt, mint a kódolóé.


Gyakorlatban is működik

Az LCLM nem elméleti játékszer: a mindennapi MI-pipeline-okba simán beilleszthető, egyszerűen lecserélhető vele bármelyik meglévő nagy nyelvi modell. Leginkább akkor hoz óriási előnyt, amikor nagy dokumentumhalmazokat vagy sok, külső forrásból összegyűjtött információt kell gyorsan, költséghatékonyan feldolgozni.

Ebből arra lehet következtetni, hogy a jövőben egy MI-modell képes lesz hatalmas adathalmazokban is gyorsan átfutni, és csak a legfontosabb részletekbe mélyed bele – pont, mint amikor egy ember átpörget egy könyvet, majd ott áll meg, ahol tényleg érdekes információt talál.

Az üzleti szférában is érezhető a robbanás: a kontextuskezelés fejlesztésére irányuló beruházások három hónap alatt a háromszorosára nőttek, márciusra első számú prioritássá léptek elő.

Hova tovább?

Három fő tanulság vonható le a vállalati alkalmazás szempontjából. Először is: a költségek egyértelműen a szövegmennyiséggel arányosan nőnek. Ha például egymillió token nagyságrendű bemenetet szeretnénk feldolgozni, a hagyományos, tömörítés nélküli technika egy NVIDIA H200 GPU memóriakorlátaiba ütközik, míg az LCLM bőven határon belül marad. Másodszor: az adatgyűjtő (RAG) pipeline-ok további finomhangolást igényelnek, mivel a tömörítési arány a visszakeresési pontosságra is hatással lehet. Harmadszor: az érvelési láncok tömörítése jelenleg még nyitott terület – ennek fejlesztésén még dolgoznak a kutatók.

Az LCLM-modellek már elérhetők a Hugging Face portálon, a kód pedig a GitHubon is szabadon böngészhető.
Ennek következtében az MI-k számára egyre kevésbé lesz határ a feldolgozható szövegmennyiség – az emberi gondolkodáshoz hasonlóan most már száguldhatnak végig gigászi dokumentumhalmokon is.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 09:19

A SpaceX minden idők legnagyobb tőzsdei kibocsátásával rekordot döntött

🚀 Elon Musk űripari vállalata, a SpaceX történelmi léptékű tőzsdei bevezetést hajtott végre: részvényeit 135 dolláros (kb...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/12

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     CrestWall – 4K Wallpapers (iPhone/iPad)A CrestWall egy gondosan válogatott, 4K felbontású háttérképeket kínáló alkalmazás, amelyet azoknak terveztek, akik fontosnak tartják iPhone-juk megjelenését...

MA 09:10

A britek fele egy csapásra tüntetné el az MI-t – főleg a fiatalok

🚀 Majdnem minden második brit felnőtt szívesen eltüntetné a generatív MI-t, ha tehetné...

MA 09:01

A TWID-ek búcsúznak: vége egy korszaknak a Destiny 2-ben

A Destiny 2-rajongók számára most egy korszak zárul le. A játék nemrég megkapta A Diadal Emlékműve (Monument of Triumph) frissítését, amely nagyjából lezárja a Destiny 2 hivatalos fejlesztéseit...

MA 08:55

Az akkumulátormentes eszköz a napfényt üzemanyaggá alakítja

Napfényből, vízből és szén-dioxidból üzemanyagot előállítani hosszú ideje a tudósok egyik legnagyobb álma...

MA 08:46

Az erőnléti edzés arany középútja a hosszabb élethez

💪 Érdemes megérteni, hogy napjainkban sokan keresik a hosszú élet kulcsát, de csak kevesen gondolnak arra, hogy a súlyzók vagy a saját testsúlyos edzés valódi aranybányát rejtenek...

MA 08:37

A Microsoft nyílt forrású SkillOptja súlyokhoz nyúlás nélkül turbózza az MI-ügynököket

🧠 A modern MI-ügynökök számtalan vállalati területen dolgoznak: összetett munkafolyamatokat hangolnak össze, segítenek adatokat elemezni és a mindennapi folyamatokat automatizálni...

MA 08:28

Az iOS 27 21 újdonsága, amire nem jutott idő a 2026-os WWDC-n

📶 Az iOS 27 nemcsak a megújult Siri MI-jétől lesz izgalmas, hanem olyan rejtett vagy kevésbé említett frissítésektől is, amelyek igazi örömet szerezhetnek az iPhone-felhasználóknak...

MA 08:19

Az MI-tesztek mit nem árulnak el a valós teljesítményről?

🤔 Ilyen eset például, amikor cégek hosszú hónapokat töltenek számítási kapacitás kiépítésével, GPU-k beszerzésével, felhőkörnyezet kialakításával, mindenhol a nyers teljesítmény mérésére koncentrálva...

MA 07:45

A rizs rejtett ereje: okos anyaggá alakították a kutatók

Külön említést érdemel, hogy a rizs, amelyet szinte mindenki csak alapvető élelmiszerként ismer, valójában egészen szokatlan módon viselkedik nyomás hatására...

MA 07:37

A biztonsági vezetők tartanak az MI-től – még kézzel nézik a kódot

🔎 A mesterséges intelligencia (MI)-alapú kódolási segédeszközök valósággal letarolják a fejlesztőcsapatokat. A szoftverek hónapról hónapra gyorsabban készülnek, mint ahogy az ellenőrzésük képes lenne követni...

MA 07:28

A C-vitamin megóvhatja az öregedő agyat? Új bizonyíték

A C-vitaminról a legtöbbeknek a megfázás elleni védekezés jut eszébe, pedig egy most megjelent, nagyszabású japán kutatás szerint sokkal nagyobb szerepet játszhat idősödő agyunk egészségének megőrzésében, mint gondolnánk...

MA 07:10

A Föld óriási földalatti gombahálózata a Tejútrendszer tizedét is lefedné, térkép szerint

A Föld legrejtettebb, de egyik legnagyobb élő birodalma a talaj alatt húzódik — a gombafonalak elképesztő szövedéke...

MA 07:01

Az Artemis III legénysége az egyik legösszetettebb űrküldetésre készül

Az Artemis III küldetése mérföldkő lesz az emberes űrrepülés történetében: a NASA hivatalosan is bemutatta azt a négy űrhajóst, akik 2027-ben indulnak útnak, és egy tartalék asztronautát is kijelöltek...

MA 06:55

A halálos galandféreg elérte az USA északnyugati partvidékét

Észak-Amerika vadonja újabb veszélyforrással szembesül: egy olyan parazita jelent meg a Csendes-óceán északnyugati partvidékének rókaféléiben, amely halálos, daganatszerű cisztákat okozhat emberekben és háziállatokban...

MA 06:46

Az újabb kriptokrach után – mi jön most?

Májusban jelentős forráskivonásokat szenvedtek el a globális kriptós ETF-ek, ez pedig a korábbi növekedést visszafordította...

MA 06:37

Az 1100 éves montanai bölényvadászhely rejtélye végre megoldódott

🩺 Több ezer évig a bölények uralták Észak-Amerika nagy síkságait, és a helyi őslakos vadászok számára nélkülözhetetlen erőforrásnak számítottak...

MA 06:28

A Fable árnyalt hírneve arannyal simán megkerülhető

💵 Felmerül a kérdés, hogy mennyit is érnek a tettek egy világban, ahol némi arannyal bárki átírhatja a múltját...

MA 06:19

Az európai bankok túllépnek az „egy nagy stabilcoin” illúzióján

A bankvilágban hatalmas átalakulás zajlik: a korábbi versengés a mindent vivő stabilcoinért elhalványul, a hangsúly inkább a különféle tokenizált pénzügyi eszközök összehangolt rendszerére helyeződik át...

MA 06:05

Történelmi események a mai napon (Június 12.)

Válogatás a történelem mai napjának fordulópontjaiból: a magyarok augsburgi győzelme, Anne Frank naplójának első napja, Reagan ikonikus berlini beszéde és az orlandói merénylet tragédiája...

csütörtök 18:02

A SpaceX tőzsdére készül: 2 billiós értéket jósol a kriptópiac

🚀 Elon Musk cége, a SpaceX a tőzsdére lépés küszöbén áll, a részvények kereskedése holnap indul a Nasdaqon...

csütörtök 17:56

Az amerikai adatközpont-vitát MI-vel hamis, Kínához köthető fiókok befolyásolták

🔮 Az OpenAI több fiókot is letiltott, amelyek a közösségi médiában igyekeztek befolyásolni az adatközpontokkal és Trump elnök vámjaival kapcsolatos amerikai vitát...

csütörtök 17:45

A TSMC máris újabb chipáremelést lebegtet – nem fog tetszeni

📈 Külön említést érdemel, hogy a számítástechnikai alkatrészek ára az utóbbi években folyamatosan nő, és nem látszik lényegi fordulat...

csütörtök 17:02

Az Insta360 Luna Ultra 8K tényleg letaszítja a DJI Pocket 4-et?

Az Insta360 új, kétkamerás Luna Ultra kamerája forradalmi újdonságot hoz a vlogging világába, hiszen 8K felbontású videózásra képes, és már 280 ezer forint körüli áron (769,99 USD) beszerezhető...

csütörtök 16:56

Az RMT-kaszinóbotok ellepték a városokat, de jön a visszavágó

🎲 Különösen igaz ez akkor, ha valaki a World of Warcraft Classic világában jár: a játékban megjelentek azok a botok, amelyek valódi pénzért cserébe árulják a játékbeli aranyat – megszegve ezzel minden szabályt...

csütörtök 16:45

Az egyik legfurcsább ujjbegyes egér: építsd meg, ha feláldozol egyet

Annak kiderítésére, hogy mennyire lehet újragondolni egy gamer egeret, valaki most egy valóban bizarr, ujjheggyel vezérelhető „pókhálós” egeret készített 3D-nyomtatható műanyag vázzal...

csütörtök 16:23

Az Alienware AW2525HM: 320 Hz-es bestia, de nem mindenkinek

👽 Az Alienware AW2525HM egy kimondottan gyors monitor, amit kifejezetten azoknak terveztek, akik a legkiemelkedőbb teljesítményt keresik kompetitív FPS játékokhoz...

csütörtök 15:12

A 2026-os vb nyitóünnepsége élőben: ingyen, tévén és neten

🏆 Érdemes tudni, hogy a 2026-os labdarúgó-világbajnokság minden eddiginél grandiózusabb lesz: összesen 48 ország csap össze 104 mérkőzésen, 39 napon keresztül, ráadásul három ország – Mexikó, Kanada és az Egyesült Államok – egyaránt otthont ad a meccseknek...

csütörtök 14:56

A ritka sírlelet rejtélye: nő, újszülött és egy ló teljes bőre Szibériában

👷 Dél-Szibériában kivételes sírt tártak fel, amelyben egy körülbelül 40 éves, középkori nő, újszülött gyermeke és egy teljes ló bőre feküdt egymás mellett...