Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak

Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak
A mesterséges intelligencia, különösen a nagy nyelvi modellek (LLM) működtetése drága mulatság, de egy izraeli–amerikai kutatócsoport új algoritmusai jelentősen csökkenthetik ezeket a költségeket. A Weizmann Intézet, az Intel Labs és a d-Matrix kutatói olyan eljárásokat mutattak be, amelyek akár 2,8-szorosára gyorsíthatják a tokenek generálását, mindössze néhány sornyi kód módosításával.

Spekulatív dekódolás: gyorsítás minőségromlás nélkül

A spekulatív dekódolás lényege, hogy egy kisebb, gyorsabb „tervezetmodellt” használnak arra, hogy előre megtippelje, mely szavakat (tokeneket) adna ki a nagyobb, lassabb, de pontosabb „célmodell”. Ha a tervezetmodell helyesen találja ki például a következő négy tokenből hármat, akkor a nagyobb modellnek ezeket már nem kell kiszámolnia, csak jóváhagynia – így értékes időt és energiát lehet spórolni. Ha téved, a célmodell újragenerálja a helyes tokeneket, tehát a minőség nem romlik. Ez a módszer hasonlít az okostelefonok prediktív szövegbeviteléhez: amikor eltalálja, mire gondolsz, egy koppintással kész is vagy, ha nem, akkor magad írod be a kívánt szót.

A trükk eddig ott volt, hogy nehéz volt megtalálni hozzá a megfelelő tervezetmodellt, mert nagyon fontos, hogy a két modell szókészlete megegyezzen. Ha nem volt a futtatni kívánt LLM-nek „kistestvére”, külön tervezetmodellt kellett fejleszteni, amelyet ráadásul minden jelentősebb LLM-frissítés után újra is kellett tanítani. Ez megnehezítette, hogy széles körben elterjedjen ez a gyorsítási lehetőség.

Univerzális tervezetmodell: bármely két LLM összehangolható

Az új algoritmusok ezt a korlátot döntik le. Mostantól bármely két modell képes lehet együtt dolgozni ebben a felállásban, még akkor is, ha a szókészletük – vagyis a szó- vagy karakterblokkokból (tokenekből) álló szótáruk – nem egyezik. Ehhez három eltérő módszert dolgoztak ki.

Az első, a Token-Level Intersection (TLI) gépiesen összeveti a két szókészletet, és kiszűri azokat a tokeneket, amelyeket a tervezetmodell nem ismer, vagy a célmodell nem tud értelmezni. Így csak az átfedő tokeneket jósolja előre; elegendő átfedés esetén már ez önmagában 1,7-szeres gyorsulást eredményez.

A második, a String-Level Exact Match (SLEM) afféle fordítórétegként működik a két modell között: az előrejelzett tokenek sorozatát köztes, ember által értelmezhető szövegre alakítja, majd ezt újra tokenizálja a célmodell szótárával. Ez precízebb, szigorúbb ellenőrzést jelent, viszont technikailag nehezebb – apró különbségek a szóközöknél vagy speciális karaktereknél visszautasításhoz vezethetnek. A kutatók egy „heurisztikus funkcióval” javították a kompatibilitást, így összetettebb feladatokban – például programkód-generálásnál vagy szövegösszefoglalásnál – már 2,8-szoros gyorsulást mértek.

Könnyen alkalmazható fejlesztőknek is

Ezek az algoritmusok nemcsak elméletben működnek: mind a TLI, mind a SLEM már bekerült a népszerű Hugging Face Transformers könyvtárba. A fejlesztőknek csupán egyetlen sornyi kódot kell módosítaniuk, hogy kihasználják az új sebességet. A szakértők szerint attól függően, milyen alkalmazási területen dolgozik valaki (szövegírás, összefoglalás, kódgenerálás), változhat, melyik módszer hoz jobb eredményt.

Néhol továbbra is hasznos lehet egy speciális tervezetmodell tanítása, de az új algoritmusok a legtöbb esetben töredékére csökkentik a spekulatív dekódolás bevezetésének nehézségeit és költségeit.


További fejlesztések kilátásban

A kutatók harmadik algoritmusa, a String-Level Rejection Sampling (SLRS) a szöveg-alapú ellenőrzések elfogadási arányát hivatott növelni. Ez egy általánosabb tervezetmodellt alkalmaz, amely nemcsak tokenekre, hanem teljes szósorozatokra vonatkozó valószínűségeket is számol – bizonyítottan javítva az elfogadási rátát. Azonban ennek valós idejű futtatása ma még túl erőforrás-igényes, ha nem igazítják hozzá a modellek szótárait.

A következő kihívás: a szótárak exponenciális növekedése. Például a Llama 4 esetében már 200 000 token szerepel, de ezek nagy részét alig használják, ami felesleges lassulást okoz. A csapat már dolgozik a szótárak zsugorításán, hogy a mesterséges intelligencia még gyorsabb és olcsóbb legyen.

Ez az innováció tehát nemcsak gyorsabb MI-t, hanem jóval pénztárcabarátabb alkalmazásokat is ígér a közeljövőben.

2025, adminboss, go.theregister.com alapján

  • Te szerinted etikus lenne, ha az algoritmust csak bizonyos cégek használhatnák, mások nem?
  • Szerinted mi lenne a legnagyobb veszély abban, ha minden fejlesztő könnyen alkalmazhatná ezeket a gyorsítási lehetőségeket?
  • Ha a te kezedben lett volna ez az újítás, mit tettél volna hozzá vagy másképp?


Legfrissebb posztok

hétfő 20:48

A Spotifyt is támadás érte: ellopták óriási zeneadatbázisát

A Spotify könyvtárát radikális, szerzői jogot sértő aktivisták teljes egészében letöltötték: összesen 256 millió sor zenei metaadatot és 86 millió audiofájlt szereztek meg, mintegy 300 TB terjedelemben...

hétfő 20:33

A táplálkozásunkon múlik, mennyire veszélyes a nanoműanyag

Az elmúlt években egyre nyilvánvalóbbá vált, hogy a műanyagok nem maradnak érintetlenek: apró, végül nanoszkopikus részecskékre esnek szét, amelyek már a csapvízben és szinte minden, műanyagba csomagolt ételben jelen vannak...

hétfő 20:17

Az álommeló korszaka lejárt: már nem menő a tech

💼 Az Apple tavaly novemberben váratlanul elbocsátásokat jelentett be, ami meglepte a dolgozókat, különösen azokat, akik évtizedek óta a cégnél dolgoztak...

hétfő 20:03

Az Ark EL íróasztal: stílusforradalom vagy giccsparádé?

A home office berendezésében mindenki szeretné megtalálni azt a bútordarabot, amely egyszerre mutatós és funkcionális, ugyanakkor elég strapabíró is, hogy bírja a mindennapi használatot...

hétfő 19:50

Az evolúció bajnokai: hogyan diadalmaskodtak az önfeláldozó hangyák?

A hangyák világa legalább annyira izgalmas, mint egy népszerű sci-fi, hiszen ezek az apró rovarok – amelyek akár néhány tucatnyi, de akár többmilliós kolóniákban is élhetnek – sikerüket nem az egyének erejének, hanem a számosságnak és a közösség hatékonyságának köszönhetik...

hétfő 19:34

A HPE súlyos sérülékenysége miatt azonnal frissítsen mindenki

⚠ A HPE OneView rendszerében felfedezett, maximális súlyosságú sebezhetőség súlyos gondokat okozhat a cégeknek, ha nem lépnek időben...

hétfő 19:16

Az Amazon-üzlet bukása pecsételte meg az iRobot sorsát

Colin Angle, az iRobot alapítója a cégét a nappalijából indította, és több mint 35 éven át építette, miközben 50 milliónál is több Roomba robotporszívót adott el világszerte...

hétfő 19:04

Az apák fittsége formálja a gyerekek jövőjét? A sperma-RNS a kulcs

Nem csak az anya, hanem az apa életmódja is – étrendje, testmozgása, stresszszintje, nikotinhasználata – képes hatni a születendő gyermekekre, méghozzá nem kizárólag genetikai úton...

hétfő 18:49

Az egyetem, ahol 3,5 millióan lettek adatlopás áldozatai

🔒 Majdnem 3,5 millió jelenlegi és volt hallgató, alkalmazott és beszállító adata szivárgott ki, miután a hírhedt Clop zsarolóvírus-csoport behatolt a Phoenix Egyetem (University of Phoenix) rendszerébe augusztusban...

hétfő 18:33

Az egészség titka: sejtjeink így zárják ki a szabadgyököket

🧠 A svédországi Lund Egyetem kutatói először rögzítették azt a pillanatot, amikor egy sejt képes lezárni a membránjában futó csatornákat, hogy megvédje magát a káros szabadgyököktől...

hétfő 18:17

Az olaszok lecsaptak az Apple-re: gigabírság az App Store miatt

Az olasz versenyhatóság közel 99 millió eurós, azaz mintegy 38 milliárd forintos bírságot szabott ki az Apple-re, mert visszaélt a piaci fölényével az App Store-ban...

hétfő 17:49

A Samsung beelőzi az összecsukható iPhone-t: érkezik az új kihívó

Az Apple hajlítható iPhone-ját még be sem jelentették, de a Samsung máris egy újabb versenytárs fejlesztésén dolgozik...

hétfő 17:18

Az iRobot Roomba megmenekült: minden marad a régiben

🚽 A Roomba porszívók tulajdonosai aggódva figyelték a fejleményeket, miután a gyártó iRobot csődeljárása során a kínai Picea kezébe került...

hétfő 17:02

Az ukrán hacker bukása: súlyos csapás a Nefilim zsarolóbandára

🔒 Egy 35 éves ukrán férfi, Artem Alekszandrovics Sztrizsak beismerte, hogy részt vett a Nefilim nevű zsarolóvírus-banda támadásaiban, amelyek főként nagy bevételű amerikai, norvég, francia, svájci, német és holland vállalatokat céloztak...

hétfő 16:49

Az Xbox válságban? Közeleg a forradalmi átalakulás

A Microsoftnál az utóbbi időben tömeges elbocsátások és stúdióbezárások rázták meg az Xbox-részleget, többen már le is írták a konzolt...

hétfő 16:34

Az új RAM-átverések tarolnak – így védekezz ellenük

Érdekes jelenség, hogy a dráguló rendszermemóriák miatt egyre gyakoribbak a RAM körüli csalások...

hétfő 16:17

Az NHS egyik kulcsbeszállítóját súlyos zsarolóvírus-támadás érte

💉 Anglia Nemzeti Egészségügyi Szolgálatának (NHS) egyik kulcsfontosságú technológiai beszállítója, a DXS International december közepén zsarolóvírus-támadást szenvedett el...

hétfő 16:03

A tengeri rózsa ősi titka: az állati sejttípusok eredete

🐬 Minden állat testében azonos a genetikai állomány, mégis rendkívül változatos sejttípusok és szövetek alakulnak ki...

hétfő 15:34

Az új ChatGPT-arcok: vállalati robot vagy zabolátlan haver?

🤖 A karácsony előtti fejlesztéshullám a ChatGPT-nél idén is folytatódik. Az OpenAI bevezette a vadonatúj személyiségbeállításokat, amelyeket a Characteristics menüpont alatt érhetsz el...