Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak

Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak
A mesterséges intelligencia, különösen a nagy nyelvi modellek (LLM) működtetése drága mulatság, de egy izraeli–amerikai kutatócsoport új algoritmusai jelentősen csökkenthetik ezeket a költségeket. A Weizmann Intézet, az Intel Labs és a d-Matrix kutatói olyan eljárásokat mutattak be, amelyek akár 2,8-szorosára gyorsíthatják a tokenek generálását, mindössze néhány sornyi kód módosításával.

Spekulatív dekódolás: gyorsítás minőségromlás nélkül

A spekulatív dekódolás lényege, hogy egy kisebb, gyorsabb „tervezetmodellt” használnak arra, hogy előre megtippelje, mely szavakat (tokeneket) adna ki a nagyobb, lassabb, de pontosabb „célmodell”. Ha a tervezetmodell helyesen találja ki például a következő négy tokenből hármat, akkor a nagyobb modellnek ezeket már nem kell kiszámolnia, csak jóváhagynia – így értékes időt és energiát lehet spórolni. Ha téved, a célmodell újragenerálja a helyes tokeneket, tehát a minőség nem romlik. Ez a módszer hasonlít az okostelefonok prediktív szövegbeviteléhez: amikor eltalálja, mire gondolsz, egy koppintással kész is vagy, ha nem, akkor magad írod be a kívánt szót.

A trükk eddig ott volt, hogy nehéz volt megtalálni hozzá a megfelelő tervezetmodellt, mert nagyon fontos, hogy a két modell szókészlete megegyezzen. Ha nem volt a futtatni kívánt LLM-nek „kistestvére”, külön tervezetmodellt kellett fejleszteni, amelyet ráadásul minden jelentősebb LLM-frissítés után újra is kellett tanítani. Ez megnehezítette, hogy széles körben elterjedjen ez a gyorsítási lehetőség.

Univerzális tervezetmodell: bármely két LLM összehangolható

Az új algoritmusok ezt a korlátot döntik le. Mostantól bármely két modell képes lehet együtt dolgozni ebben a felállásban, még akkor is, ha a szókészletük – vagyis a szó- vagy karakterblokkokból (tokenekből) álló szótáruk – nem egyezik. Ehhez három eltérő módszert dolgoztak ki.

Az első, a Token-Level Intersection (TLI) gépiesen összeveti a két szókészletet, és kiszűri azokat a tokeneket, amelyeket a tervezetmodell nem ismer, vagy a célmodell nem tud értelmezni. Így csak az átfedő tokeneket jósolja előre; elegendő átfedés esetén már ez önmagában 1,7-szeres gyorsulást eredményez.

A második, a String-Level Exact Match (SLEM) afféle fordítórétegként működik a két modell között: az előrejelzett tokenek sorozatát köztes, ember által értelmezhető szövegre alakítja, majd ezt újra tokenizálja a célmodell szótárával. Ez precízebb, szigorúbb ellenőrzést jelent, viszont technikailag nehezebb – apró különbségek a szóközöknél vagy speciális karaktereknél visszautasításhoz vezethetnek. A kutatók egy „heurisztikus funkcióval” javították a kompatibilitást, így összetettebb feladatokban – például programkód-generálásnál vagy szövegösszefoglalásnál – már 2,8-szoros gyorsulást mértek.

Könnyen alkalmazható fejlesztőknek is

Ezek az algoritmusok nemcsak elméletben működnek: mind a TLI, mind a SLEM már bekerült a népszerű Hugging Face Transformers könyvtárba. A fejlesztőknek csupán egyetlen sornyi kódot kell módosítaniuk, hogy kihasználják az új sebességet. A szakértők szerint attól függően, milyen alkalmazási területen dolgozik valaki (szövegírás, összefoglalás, kódgenerálás), változhat, melyik módszer hoz jobb eredményt.

Néhol továbbra is hasznos lehet egy speciális tervezetmodell tanítása, de az új algoritmusok a legtöbb esetben töredékére csökkentik a spekulatív dekódolás bevezetésének nehézségeit és költségeit.


További fejlesztések kilátásban

A kutatók harmadik algoritmusa, a String-Level Rejection Sampling (SLRS) a szöveg-alapú ellenőrzések elfogadási arányát hivatott növelni. Ez egy általánosabb tervezetmodellt alkalmaz, amely nemcsak tokenekre, hanem teljes szósorozatokra vonatkozó valószínűségeket is számol – bizonyítottan javítva az elfogadási rátát. Azonban ennek valós idejű futtatása ma még túl erőforrás-igényes, ha nem igazítják hozzá a modellek szótárait.

A következő kihívás: a szótárak exponenciális növekedése. Például a Llama 4 esetében már 200 000 token szerepel, de ezek nagy részét alig használják, ami felesleges lassulást okoz. A csapat már dolgozik a szótárak zsugorításán, hogy a mesterséges intelligencia még gyorsabb és olcsóbb legyen.

Ez az innováció tehát nemcsak gyorsabb MI-t, hanem jóval pénztárcabarátabb alkalmazásokat is ígér a közeljövőben.

2025, adminboss, go.theregister.com alapján

  • Te szerinted etikus lenne, ha az algoritmust csak bizonyos cégek használhatnák, mások nem?
  • Szerinted mi lenne a legnagyobb veszély abban, ha minden fejlesztő könnyen alkalmazhatná ezeket a gyorsítási lehetőségeket?
  • Ha a te kezedben lett volna ez az újítás, mit tettél volna hozzá vagy másképp?



Legfrissebb posztok

szombat 20:28

Újabb tehertétel az NHS-nek: drága cserekészülékek és a Windows 11

💸 A brit kórházakban jelenleg is zajlik a régi eszközök frissítése Windows 11-re, ám néhány beszállító továbbra sem teszi kompatibilissé a berendezéseit az új operációs rendszerrel...



szombat 20:18

Az új Bluesky funkció: Nem tetszik gomb a toxikus tartalom ellen

Bluesky elérte a 40 millió felhasználót, és új megoldásokkal teszi személyre szabottabbá a közösségi élményt...



szombat 20:10

Az ausztrál oposszumok mérgezett élete: PFAS-szint rekordok

Ausztrália környékén élő oposszumok mára a világ egyik legszennyezettebb kisemlősévé váltak: minden megvizsgált példány májában kimutatták a szintetikus, úgynevezett „örök vegyi anyagok” (PFAS) jelenlétét, ráadásul rekordmagas koncentrációban...

szombat 19:45

Az olcsó napelemek forradalmat hoztak – kivéve Amerikában

A napelemárak globális zuhanása hatalmas lendületet adott a napenergia terjedésének világszerte, de az Egyesült Államokban most éppen lelassul ez a fellendülés...

szombat 19:37

A mianmari földrengés gyorsabb volt, mint a földhang

2025. március 28-án Mianmarban pusztító földrengés rázta meg a Sagaing-törést: ez volt az egyik leghosszabb és leggyorsabb szárazföldi törés a mérési történelemben...

szombat 19:28

Az Adobe MI-je már egy képkockából is videót szerkeszt

Az Adobe új, kísérleti MI-eszközei forradalmasíthatják a videó- és képszerkesztést. Az Adobe Max konferencián bemutatott újdonságok között szerepelnek olyan funkciók, amelyeket elég csak egyetlen képkockán alkalmazni, a változásokat pedig a rendszer automatikusan áthúzza az egész videón...



szombat 19:10

Az első csillagszomszéd bolygó: Új remény a földönkívüli életre

1995. november 1-jén a svájci Michel Mayor és Didier Queloz forradalmi felfedezéssel robbant be a csillagászat történetébe...

szombat 19:01

Az űrben vadászik a kozmikus denevér

Egy igazán hátborzongató, denevéralakú köd bukkant fel a déli égbolton, amelyet európai csillagászok örökítettek meg Chile legendás Paranal obszervatóriumánál...

szombat 18:55

Az óriási pénzhegy: a Berkshire ismét tarolt, de Buffett tovább gyűjt

💰 A Berkshire Hathaway harmadik negyedéves működési nyeresége 34%-kal ugrott meg, elérve a 13,5 milliárd dollárt (közel 4 920 milliárd forintot)...



szombat 18:47

Black Friday, most akár 180 ezer forinttal olcsóbbak a laptopok

💰 Már beindultak az őrült Black Friday laptopakciók, és a legnagyobb áruházak (mint a Best Buy vagy az Amazon) jóval a nagy nap előtt elengedték az árakat...

szombat 18:36

Az MI-s kereső megegyezett a Getty Images-szel: vége a képbotránynak?

Az MI-alapú keresést fejlesztő Perplexity többléves licencszerződést kötött a Getty Images-szel, amelynek értelmében immár jogszerűen jelenítheti meg a Getty képeit keresési és felfedezési szolgáltatásaiban...

szombat 18:28

Az UPenn elleni hackertámadás: adatlopás, fenyegetés, botrány

Péntek reggel a Pennsylvaniai Egyetem (UPenn) jelenlegi és egykori hallgatói, dolgozói és partnerei több olyan levelet kaptak, amelyekben hackerek a Graduate School of Education (GSE) nevében fenyegetőztek...

szombat 18:19

Az űrállomás, ahol a kungfu és a költészet is elfér

Kína két év alatt saját rekordját is megdöntötte: a Shenzhou–21 űrhajó mindössze 3,5 óra alatt dokkolt a kínai űrállomáson, ami három órával gyorsabb, mint eddig bármelyik hasonló küldetés...

szombat 18:10

Az MI egy új szuperenzimmel segíthet lebontani a műanyagot

A műanyag hulladék évtizedek óta hatalmas ökológiai problémát jelent. A különféle műanyagokat eltérő tulajdonságaik miatt többféle polimerből készítik, amelyeket más-más kémiai kötések tartanak össze, így az egyikhez jól működő bomlasztási eljárás teljesen alkalmatlan lehet egy másikhoz...

szombat 17:55

Újabb kriptobotrány: 4 milliárd forintos lopás a Garden Finance-nél

A decentralizált pénzügyek világában ismét nagy port kavart egy bűncselekmény: a Garden Finance nevű blokklánchíd-protokollt támadás érte, amelynek során több mint 11 millió dollár (kb...

szombat 17:46

Az oltásellenesség miatt kanyarójárvány tört ki Utahban

Az Arizona és Utah határvidékén komoly kanyarójárvány robbant ki, de Salt Lake City környékén a védekezést egy makacs páciens most szinte ellehetetleníti: nem hajlandó együttműködni a hatóságokkal, sőt még a saját címét sem árulja el...

szombat 17:36

Az FCC elengedi a kötelező hálózatbiztonságot az internetszolgáltatóknál

Az Egyesült Államok hírközlési hatósága, az FCC visszavonja azt a szabályt, amely kötelezte az internetszolgáltatókat hálózataik védelmére...

szombat 17:28

A YouTube-on már mesterséges intelligencia moderál

💻 A YouTube MI-alapú moderációs rendszere néhány napja egyre több, Windows 11 telepítési trükköt bemutató videót töröl, veszélyesnek minősítve azokat...



szombat 17:20

Az okostelefonok és a képernyők a gyerekek szívét is megterhelhetik

💔 A mai világban a képernyők szinte láthatatlanul szövik pókhálójukat a mindennapjaink köré...