Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak

Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak
A mesterséges intelligencia, különösen a nagy nyelvi modellek (LLM) működtetése drága mulatság, de egy izraeli–amerikai kutatócsoport új algoritmusai jelentősen csökkenthetik ezeket a költségeket. A Weizmann Intézet, az Intel Labs és a d-Matrix kutatói olyan eljárásokat mutattak be, amelyek akár 2,8-szorosára gyorsíthatják a tokenek generálását, mindössze néhány sornyi kód módosításával.

Spekulatív dekódolás: gyorsítás minőségromlás nélkül

A spekulatív dekódolás lényege, hogy egy kisebb, gyorsabb „tervezetmodellt” használnak arra, hogy előre megtippelje, mely szavakat (tokeneket) adna ki a nagyobb, lassabb, de pontosabb „célmodell”. Ha a tervezetmodell helyesen találja ki például a következő négy tokenből hármat, akkor a nagyobb modellnek ezeket már nem kell kiszámolnia, csak jóváhagynia – így értékes időt és energiát lehet spórolni. Ha téved, a célmodell újragenerálja a helyes tokeneket, tehát a minőség nem romlik. Ez a módszer hasonlít az okostelefonok prediktív szövegbeviteléhez: amikor eltalálja, mire gondolsz, egy koppintással kész is vagy, ha nem, akkor magad írod be a kívánt szót.

A trükk eddig ott volt, hogy nehéz volt megtalálni hozzá a megfelelő tervezetmodellt, mert nagyon fontos, hogy a két modell szókészlete megegyezzen. Ha nem volt a futtatni kívánt LLM-nek „kistestvére”, külön tervezetmodellt kellett fejleszteni, amelyet ráadásul minden jelentősebb LLM-frissítés után újra is kellett tanítani. Ez megnehezítette, hogy széles körben elterjedjen ez a gyorsítási lehetőség.

Univerzális tervezetmodell: bármely két LLM összehangolható

Az új algoritmusok ezt a korlátot döntik le. Mostantól bármely két modell képes lehet együtt dolgozni ebben a felállásban, még akkor is, ha a szókészletük – vagyis a szó- vagy karakterblokkokból (tokenekből) álló szótáruk – nem egyezik. Ehhez három eltérő módszert dolgoztak ki.

Az első, a Token-Level Intersection (TLI) gépiesen összeveti a két szókészletet, és kiszűri azokat a tokeneket, amelyeket a tervezetmodell nem ismer, vagy a célmodell nem tud értelmezni. Így csak az átfedő tokeneket jósolja előre; elegendő átfedés esetén már ez önmagában 1,7-szeres gyorsulást eredményez.

A második, a String-Level Exact Match (SLEM) afféle fordítórétegként működik a két modell között: az előrejelzett tokenek sorozatát köztes, ember által értelmezhető szövegre alakítja, majd ezt újra tokenizálja a célmodell szótárával. Ez precízebb, szigorúbb ellenőrzést jelent, viszont technikailag nehezebb – apró különbségek a szóközöknél vagy speciális karaktereknél visszautasításhoz vezethetnek. A kutatók egy „heurisztikus funkcióval” javították a kompatibilitást, így összetettebb feladatokban – például programkód-generálásnál vagy szövegösszefoglalásnál – már 2,8-szoros gyorsulást mértek.

Könnyen alkalmazható fejlesztőknek is

Ezek az algoritmusok nemcsak elméletben működnek: mind a TLI, mind a SLEM már bekerült a népszerű Hugging Face Transformers könyvtárba. A fejlesztőknek csupán egyetlen sornyi kódot kell módosítaniuk, hogy kihasználják az új sebességet. A szakértők szerint attól függően, milyen alkalmazási területen dolgozik valaki (szövegírás, összefoglalás, kódgenerálás), változhat, melyik módszer hoz jobb eredményt.

Néhol továbbra is hasznos lehet egy speciális tervezetmodell tanítása, de az új algoritmusok a legtöbb esetben töredékére csökkentik a spekulatív dekódolás bevezetésének nehézségeit és költségeit.


További fejlesztések kilátásban

A kutatók harmadik algoritmusa, a String-Level Rejection Sampling (SLRS) a szöveg-alapú ellenőrzések elfogadási arányát hivatott növelni. Ez egy általánosabb tervezetmodellt alkalmaz, amely nemcsak tokenekre, hanem teljes szósorozatokra vonatkozó valószínűségeket is számol – bizonyítottan javítva az elfogadási rátát. Azonban ennek valós idejű futtatása ma még túl erőforrás-igényes, ha nem igazítják hozzá a modellek szótárait.

A következő kihívás: a szótárak exponenciális növekedése. Például a Llama 4 esetében már 200 000 token szerepel, de ezek nagy részét alig használják, ami felesleges lassulást okoz. A csapat már dolgozik a szótárak zsugorításán, hogy a mesterséges intelligencia még gyorsabb és olcsóbb legyen.

Ez az innováció tehát nemcsak gyorsabb MI-t, hanem jóval pénztárcabarátabb alkalmazásokat is ígér a közeljövőben.

2025, adminboss, go.theregister.com alapján

  • Te szerinted etikus lenne, ha az algoritmust csak bizonyos cégek használhatnák, mások nem?
  • Szerinted mi lenne a legnagyobb veszély abban, ha minden fejlesztő könnyen alkalmazhatná ezeket a gyorsítási lehetőségeket?
  • Ha a te kezedben lett volna ez az újítás, mit tettél volna hozzá vagy másképp?



Legfrissebb posztok

Az új VoidProxy átveri a Microsoft és Google fiókokat

MA 11:01

Az új VoidProxy átveri a Microsoft és Google fiókokat

A VoidProxy nevű, frissen felbukkant adathalász szolgáltatás a Microsoft 365 és Google fiókokat veszi célba, beleértve azokat is, amelyeket külső, egyjeles azonosítási (SSO) rendszerek, például az Okta véd....

Az orosz hackerek legújabb kudarca: az Amazon keresztbe tett az APT29-nek

MA 10:53

Az orosz hackerek legújabb kudarca: az Amazon keresztbe tett az APT29-nek

🔒 Az Amazon kutatói sikeresen megakadályozták az orosz állam által támogatott Midnight Blizzard (APT29) nevű hackercsoport támadását, amely a Microsoft 365-fiókokhoz és adatokhoz próbált titokban hozzáférni. A csoport célzott...

Valóban wellnessközpont lehetett régen a Mars, vagy csak legenda?

MA 10:40

Valóban wellnessközpont lehetett régen a Mars, vagy csak legenda?

🚀 Az elmúlt évmilliárdok során a Mars drasztikusan megváltozott: míg ma fagyos sivatag, egyes új kutatások szerint valaha aktív vulkánok kénes gázokat juttattak a légkörbe, amelyek üvegházhatást okozva melegen...

Lehet, hogy a túlzott soványság nagyobb baj, mint hinnéd

MA 10:28

Lehet, hogy a túlzott soványság nagyobb baj, mint hinnéd

Újabb meglepő fordulatot vett a testsúlyról és egészségről szóló vita: egy dán kutatás szerint a soványság akár nagyobb kockázatot is jelenthet, mint a túlsúly. A kutatás adatai alapján...

Az okos sejtek messzebbre érzékelnek, mint hinnéd

MA 10:14

Az okos sejtek messzebbre érzékelnek, mint hinnéd

💡 Meseinek tűnhet, hogy valaki egy borsószemet is megérez a matracok alatt (ahogy az Andersen-mesében), mégis a biológia világában bizonyos sejtek hasonlóan érzékenyek lehetnek. Nemcsak ráksejtekről van szó: kutatók...

A bolíviai rejtélyes fej valójában egészen más, mint hinnénk

MA 10:02

A bolíviai rejtélyes fej valójában egészen más, mint hinnénk

Egy különös, mumifikálódott fej több mint száz éve pihen egy svájci múzeum gyűjteményében, eredetét azonban mostanáig félreértették. Eddig úgy vélték, hogy egy inka férfi maradványa, de a legfrissebb...

Az MI-gigászok még csak most kezdik igazán!

MA 09:27

Az MI-gigászok még csak most kezdik igazán!

🚀 A technológiai óriások, az úgynevezett Hét csodálatos (Magnificent Seven: Apple, Amazon, Alphabet, Nvidia, Meta, Microsoft és Tesla) elképesztő ütemben növekedtek az elmúlt években, és semmi sem utal arra,...

APPok, Amik Ingyenesek MA, 9/16
APP

MA 09:11

APPok, Amik Ingyenesek MA, 9/16

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     WeComics TH: Webtoon (iPhone/iPad)A WeComics TH egy thaiföldi képregényolvasó platform, ahol több ezer, szerzői joggal védett...

Véget ért az ingyenes Amazon Prime-osztozkodás korszaka

MA 08:52

Véget ért az ingyenes Amazon Prime-osztozkodás korszaka

😔 Az Amazon 2024. október 1-jével megszünteti a Prime Invitee programot, amely korábban lehetővé tette, hogy a Prime-tagok ingyenes szállítási jogosultságukat házon kívüli ismerőseikkel is megosszák. Az eddig meghívott...