Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak

Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak
A mesterséges intelligencia, különösen a nagy nyelvi modellek (LLM) működtetése drága mulatság, de egy izraeli–amerikai kutatócsoport új algoritmusai jelentősen csökkenthetik ezeket a költségeket. A Weizmann Intézet, az Intel Labs és a d-Matrix kutatói olyan eljárásokat mutattak be, amelyek akár 2,8-szorosára gyorsíthatják a tokenek generálását, mindössze néhány sornyi kód módosításával.

Spekulatív dekódolás: gyorsítás minőségromlás nélkül

A spekulatív dekódolás lényege, hogy egy kisebb, gyorsabb „tervezetmodellt” használnak arra, hogy előre megtippelje, mely szavakat (tokeneket) adna ki a nagyobb, lassabb, de pontosabb „célmodell”. Ha a tervezetmodell helyesen találja ki például a következő négy tokenből hármat, akkor a nagyobb modellnek ezeket már nem kell kiszámolnia, csak jóváhagynia – így értékes időt és energiát lehet spórolni. Ha téved, a célmodell újragenerálja a helyes tokeneket, tehát a minőség nem romlik. Ez a módszer hasonlít az okostelefonok prediktív szövegbeviteléhez: amikor eltalálja, mire gondolsz, egy koppintással kész is vagy, ha nem, akkor magad írod be a kívánt szót.

A trükk eddig ott volt, hogy nehéz volt megtalálni hozzá a megfelelő tervezetmodellt, mert nagyon fontos, hogy a két modell szókészlete megegyezzen. Ha nem volt a futtatni kívánt LLM-nek „kistestvére”, külön tervezetmodellt kellett fejleszteni, amelyet ráadásul minden jelentősebb LLM-frissítés után újra is kellett tanítani. Ez megnehezítette, hogy széles körben elterjedjen ez a gyorsítási lehetőség.

Univerzális tervezetmodell: bármely két LLM összehangolható

Az új algoritmusok ezt a korlátot döntik le. Mostantól bármely két modell képes lehet együtt dolgozni ebben a felállásban, még akkor is, ha a szókészletük – vagyis a szó- vagy karakterblokkokból (tokenekből) álló szótáruk – nem egyezik. Ehhez három eltérő módszert dolgoztak ki.

Az első, a Token-Level Intersection (TLI) gépiesen összeveti a két szókészletet, és kiszűri azokat a tokeneket, amelyeket a tervezetmodell nem ismer, vagy a célmodell nem tud értelmezni. Így csak az átfedő tokeneket jósolja előre; elegendő átfedés esetén már ez önmagában 1,7-szeres gyorsulást eredményez.

A második, a String-Level Exact Match (SLEM) afféle fordítórétegként működik a két modell között: az előrejelzett tokenek sorozatát köztes, ember által értelmezhető szövegre alakítja, majd ezt újra tokenizálja a célmodell szótárával. Ez precízebb, szigorúbb ellenőrzést jelent, viszont technikailag nehezebb – apró különbségek a szóközöknél vagy speciális karaktereknél visszautasításhoz vezethetnek. A kutatók egy „heurisztikus funkcióval” javították a kompatibilitást, így összetettebb feladatokban – például programkód-generálásnál vagy szövegösszefoglalásnál – már 2,8-szoros gyorsulást mértek.

Könnyen alkalmazható fejlesztőknek is

Ezek az algoritmusok nemcsak elméletben működnek: mind a TLI, mind a SLEM már bekerült a népszerű Hugging Face Transformers könyvtárba. A fejlesztőknek csupán egyetlen sornyi kódot kell módosítaniuk, hogy kihasználják az új sebességet. A szakértők szerint attól függően, milyen alkalmazási területen dolgozik valaki (szövegírás, összefoglalás, kódgenerálás), változhat, melyik módszer hoz jobb eredményt.

Néhol továbbra is hasznos lehet egy speciális tervezetmodell tanítása, de az új algoritmusok a legtöbb esetben töredékére csökkentik a spekulatív dekódolás bevezetésének nehézségeit és költségeit.


További fejlesztések kilátásban

A kutatók harmadik algoritmusa, a String-Level Rejection Sampling (SLRS) a szöveg-alapú ellenőrzések elfogadási arányát hivatott növelni. Ez egy általánosabb tervezetmodellt alkalmaz, amely nemcsak tokenekre, hanem teljes szósorozatokra vonatkozó valószínűségeket is számol – bizonyítottan javítva az elfogadási rátát. Azonban ennek valós idejű futtatása ma még túl erőforrás-igényes, ha nem igazítják hozzá a modellek szótárait.

A következő kihívás: a szótárak exponenciális növekedése. Például a Llama 4 esetében már 200 000 token szerepel, de ezek nagy részét alig használják, ami felesleges lassulást okoz. A csapat már dolgozik a szótárak zsugorításán, hogy a mesterséges intelligencia még gyorsabb és olcsóbb legyen.

Ez az innováció tehát nemcsak gyorsabb MI-t, hanem jóval pénztárcabarátabb alkalmazásokat is ígér a közeljövőben.

2025, adminboss, go.theregister.com alapján

  • Te szerinted etikus lenne, ha az algoritmust csak bizonyos cégek használhatnák, mások nem?
  • Szerinted mi lenne a legnagyobb veszély abban, ha minden fejlesztő könnyen alkalmazhatná ezeket a gyorsítási lehetőségeket?
  • Ha a te kezedben lett volna ez az újítás, mit tettél volna hozzá vagy másképp?



Legfrissebb posztok

MA 18:46

Az 5000 éves iraki szentély, amely átírja a történelemkönyveket

Észak-Irakban, a Zagros-hegység lábánál, a Kani Shaie régészeti helyszínen egy 5000 éves épület maradványaira bukkantak...

MA 18:37

A szárazság nyomait őrző talaj megmentheti a növényeket

🌱 Az utóbbi évek egyik legizgalmasabb felfedezése, hogy a talajban élő mikroorganizmusok, például baktériumok és gombák nemcsak rövid távon hatnak a növényekre, hanem valóságos „emlékezettel” is rendelkeznek...

MA 18:27

Az ártatlan nőt az MI vádolta meg, de a saját autója mentette meg

Chrisanna Elsertet egy este váratlanul felkereste a rendőrség, mert csomaglopással vádolták...

MA 18:19

Az anyai COVID-fertőzés növelheti az autizmus kockázatát

🩹 Egy új kutatás arra utal, hogy a terhesség alatti COVID-fertőzés mintegy 30 százalékkal növelheti a gyermekeknél kialakuló autizmus vagy más idegrendszeri rendellenességek valószínűségét...

MA 18:10

A Szaturnusz holdján felborulnak az élet szabályai

🚀 A Szaturnusz legnagyobb holdján, a Titánon különös kémiai folyamatok zajlanak, amelyek teljesen felborítják földi elképzeléseinket arról, hogyan viselkednek bizonyos anyagok egymás mellett...



MA 18:01

Az eldobható lányok: új bizonyíték a kelta áldozatokra

🔭 Rejtélyes maradványokat találtak régészek Angliában: három kelta nő és lány sírját, akiknél mind fennáll a gyanú, hogy rituális áldozatok lehettek...

MA 17:55

Az űr legvadabb tűzijátéka: a Szivar-galaxis lángoló szíve

💥 A James Webb-űrteleszkóp új képe szinte lángba borította a Szivar-galaxist (M82), amelynek magjában féktelen csillagképződés és galaktikus szelek világítják be az infravörös univerzumot...



MA 17:47

Izik az ég, napkitörések, dühös chatbotok és egy apró T. rex

🔥 A hét tudományos híreinek középpontjában hatalmas felfedezések álltak: friss kutatások fényt derítettek arra, miért sokkal forróbb a Nap külső légköre, mint a magja...



MA 17:37

Az LG B5 OLED TV hihetetlen áron: ilyen olcsón még nem volt

Az LG 48 colos B5 OLED TV Black Friday alkalmából már 191 000 forintért kapható a Best Buynál, ami nagyjából 270 000 forint kedvezményt jelent a megszokott árhoz képest...



MA 17:28

Az Apple MacBook Air most fillérekért vihető

💰 Ha régóta vadászol egy megbízható laptopra, de nem akarsz vagyonokat költeni, most itt a lehetőség...



MA 17:20

Ma éjjel mindent eldönt a Dodgers és a Blue Jays baseballmeccse

⚾ A Los Angeles Dodgers és a Toronto Blue Jays párharca óriási izgalmakat hozott: az eredmény 3–3, így a világ szeme az utolsó, mindent eldöntő összecsapásra szegeződik...

MA 17:10

Az olaszok bekeményítenek: minden pornóoldalhoz életkor-ellenőrzés kell

💪 November közepétől az olasz internetezőknek már nem lesz elég csak kattintaniuk, ha pornóoldalakat szeretnének felkeresni: új szabályozás lép életbe, amelynek célja a kiskorúak elzárása a felnőtt tartalmak elől...



MA 17:01

Az óceán mikrovilága eddig ismeretlen titkokat tár fel

Különösen fontos kiemelni, hogy a mikroszkópos technológia legújabb vívmánya forradalmasítja az óceáni planktonok vizsgálatát...

MA 16:55

Valóban színesek az álmaink vagy fekete-fehérek?

🎨 Az álmaink színvilágát nagyban befolyásolja, hogy mit nézünk a tévében és a moziban...

MA 16:46

Az MI már a fűnyírókat is elérte, kipróbáltuk a Sunseeker Elite X5-öt

🪔 Megérkezett a Sunseeker Elite X5, amely egyetlen gombnyomással elvégzi a fűnyírást a kertben, ráadásul már MI-t is használ, hogy ügyesen kikerülje a macskákat, játékokat és egyéb akadályokat...

MA 16:36

Az őslényharc, ami átírja a T. rex történetét

🔥 Az őslénykutatók évtizedes vitája zárult le a montanai híres Párbajozó dinoszauruszok (Dueling Dinosaurs) lelet elemzésével, ahol egy Triceratops és egy kisebb testű ragadozó fosszíliáját találták meg, örök mozdulatban egymásba gabalyodva...



MA 16:28

Az egészségügy jövője, ne ártsunk a bolygónak sem

Minden egyes eszköz, amelyet használunk – legyen az mobiltelefon, hűtőszekrény vagy éppen egy kórházi fecskendő – a Föld erőforrásaiból származik, és végső soron oda is kerül vissza...

MA 16:01

Az év futó óradömpingje: olcsóbban vihető a Garmin Forerunner 165

🕐 A Garmin Forerunner 165 az egyik legjobb belépő kategóriás futóóra jelenleg a piacon, most pedig minden eddiginél kedvezőbb áron lehet hozzájutni...

MA 15:55

Az undok, halszagú baba esete: amikor az anyuka is csak csóválja a fejét

😷 Egy portugál kisfiú élete hirtelen tele lett furcsa szagokkal: halételek elfogyasztása után a teste erős, rothadó halra emlékeztető szagot kezdett árasztani, különösen a fején és a kezén volt zavaró a bűz...