2025. 07. 21., 15:28

Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak

Az MI olcsóbb lesz, mint gondolnád? Új algoritmusok gyorsítanak
A mesterséges intelligencia, különösen a nagy nyelvi modellek (LLM) működtetése drága mulatság, de egy izraeli–amerikai kutatócsoport új algoritmusai jelentősen csökkenthetik ezeket a költségeket. A Weizmann Intézet, az Intel Labs és a d-Matrix kutatói olyan eljárásokat mutattak be, amelyek akár 2,8-szorosára gyorsíthatják a tokenek generálását, mindössze néhány sornyi kód módosításával.

Spekulatív dekódolás: gyorsítás minőségromlás nélkül

A spekulatív dekódolás lényege, hogy egy kisebb, gyorsabb „tervezetmodellt” használnak arra, hogy előre megtippelje, mely szavakat (tokeneket) adna ki a nagyobb, lassabb, de pontosabb „célmodell”. Ha a tervezetmodell helyesen találja ki például a következő négy tokenből hármat, akkor a nagyobb modellnek ezeket már nem kell kiszámolnia, csak jóváhagynia – így értékes időt és energiát lehet spórolni. Ha téved, a célmodell újragenerálja a helyes tokeneket, tehát a minőség nem romlik. Ez a módszer hasonlít az okostelefonok prediktív szövegbeviteléhez: amikor eltalálja, mire gondolsz, egy koppintással kész is vagy, ha nem, akkor magad írod be a kívánt szót.

A trükk eddig ott volt, hogy nehéz volt megtalálni hozzá a megfelelő tervezetmodellt, mert nagyon fontos, hogy a két modell szókészlete megegyezzen. Ha nem volt a futtatni kívánt LLM-nek „kistestvére”, külön tervezetmodellt kellett fejleszteni, amelyet ráadásul minden jelentősebb LLM-frissítés után újra is kellett tanítani. Ez megnehezítette, hogy széles körben elterjedjen ez a gyorsítási lehetőség.

Univerzális tervezetmodell: bármely két LLM összehangolható

Az új algoritmusok ezt a korlátot döntik le. Mostantól bármely két modell képes lehet együtt dolgozni ebben a felállásban, még akkor is, ha a szókészletük – vagyis a szó- vagy karakterblokkokból (tokenekből) álló szótáruk – nem egyezik. Ehhez három eltérő módszert dolgoztak ki.

Az első, a Token-Level Intersection (TLI) gépiesen összeveti a két szókészletet, és kiszűri azokat a tokeneket, amelyeket a tervezetmodell nem ismer, vagy a célmodell nem tud értelmezni. Így csak az átfedő tokeneket jósolja előre; elegendő átfedés esetén már ez önmagában 1,7-szeres gyorsulást eredményez.

A második, a String-Level Exact Match (SLEM) afféle fordítórétegként működik a két modell között: az előrejelzett tokenek sorozatát köztes, ember által értelmezhető szövegre alakítja, majd ezt újra tokenizálja a célmodell szótárával. Ez precízebb, szigorúbb ellenőrzést jelent, viszont technikailag nehezebb – apró különbségek a szóközöknél vagy speciális karaktereknél visszautasításhoz vezethetnek. A kutatók egy „heurisztikus funkcióval” javították a kompatibilitást, így összetettebb feladatokban – például programkód-generálásnál vagy szövegösszefoglalásnál – már 2,8-szoros gyorsulást mértek.

Könnyen alkalmazható fejlesztőknek is

Ezek az algoritmusok nemcsak elméletben működnek: mind a TLI, mind a SLEM már bekerült a népszerű Hugging Face Transformers könyvtárba. A fejlesztőknek csupán egyetlen sornyi kódot kell módosítaniuk, hogy kihasználják az új sebességet. A szakértők szerint attól függően, milyen alkalmazási területen dolgozik valaki (szövegírás, összefoglalás, kódgenerálás), változhat, melyik módszer hoz jobb eredményt.

Néhol továbbra is hasznos lehet egy speciális tervezetmodell tanítása, de az új algoritmusok a legtöbb esetben töredékére csökkentik a spekulatív dekódolás bevezetésének nehézségeit és költségeit.


További fejlesztések kilátásban

A kutatók harmadik algoritmusa, a String-Level Rejection Sampling (SLRS) a szöveg-alapú ellenőrzések elfogadási arányát hivatott növelni. Ez egy általánosabb tervezetmodellt alkalmaz, amely nemcsak tokenekre, hanem teljes szósorozatokra vonatkozó valószínűségeket is számol – bizonyítottan javítva az elfogadási rátát. Azonban ennek valós idejű futtatása ma még túl erőforrás-igényes, ha nem igazítják hozzá a modellek szótárait.

A következő kihívás: a szótárak exponenciális növekedése. Például a Llama 4 esetében már 200 000 token szerepel, de ezek nagy részét alig használják, ami felesleges lassulást okoz. A csapat már dolgozik a szótárak zsugorításán, hogy a mesterséges intelligencia még gyorsabb és olcsóbb legyen.

Ez az innováció tehát nemcsak gyorsabb MI-t, hanem jóval pénztárcabarátabb alkalmazásokat is ígér a közeljövőben.

2025, adminboss, go.theregister.com alapján

  • Te szerinted etikus lenne, ha az algoritmust csak bizonyos cégek használhatnák, mások nem?
  • Szerinted mi lenne a legnagyobb veszély abban, ha minden fejlesztő könnyen alkalmazhatná ezeket a gyorsítási lehetőségeket?
  • Ha a te kezedben lett volna ez az újítás, mit tettél volna hozzá vagy másképp?


Legfrissebb posztok

MA 08:36

Az egészségügyi óriásnál kitört az adatbotrány: páciensek adatai szivárogtak ki

💉 Egy nyolcórás hálózati leállással járó betörés során hackerek jutottak hozzá a CareCloud egyik kritikus rendszeréhez...

MA 08:29

A kvantumkorszak vártnál előbb csaphat le a Bitcoinra

Ami először apróságnak tűnt, most alapjaiban rengetheti meg a kriptovaluták védelmét: a Google kvantumszakértői szerint a Bitcoin és az Ethereum meglévő titkosítása már a vártnál jóval kevesebb kvantumkapacitással is legyőzhető...

MA 08:23

A kritikus nyersanyagok aranyárban: Kína fogságában a világ ellátása

💰 Az elmúlt hetekben három kevéssé ismert, ám nélkülözhetetlen nyersanyag ára szállt el világszerte: a volfrám, a kén és a hélium mind masszív drágulást produkált, néhol az olajhoz képest is nagyobb mértékben...

MA 08:15

Az Android Auto hibája eltünteti a térerőjelzőket – nyugi, van megoldás

Az utóbbi hetekben egyre több Android Auto-felhasználó vette észre, hogy eltűnt a térerőjelző a jármű műszerfaláról...

MA 08:08

Az Apple nagy dobása közeleg: érkezik az iPhone Fold?

Az Apple hamarosan nagyot léphet előre: a hajlítható iPhone teljesen új korszakot nyithat a mobilok világában...

MA 08:01

Az Artemis II zöld utat kapott: indulhat a Hold felé

A NASA történelmi jelentőségű küldetése, az Artemis II végre elindulhat: a 10 napos küldetés minden engedélyt megkapott egy átfogó repüléskészségi felülvizsgálat után, az időjárás-előrejelzés pedig biztató...

MA 07:57

Az amerikai nyugdíjvagyon is kriptóba áramolhat

💰 Az Egyesült Államok Munkaügyi Minisztériuma új szabályozást terjesztett elő, amely megnyithatja az utat a nyugdíj-megtakarítási programokban felhalmozott több ezermilliárd dollárnyi vagyon számára a kriptovaluták, a magántőke és az ingatlanbefektetések felé...

MA 07:50

Az új, 3000 milliárdos katonai GPS továbbra is működésképtelen

🚩 Tizenhat évnyi fejlesztés, 3000 milliárd forintnál is drágább projekt, és még mindig működésképtelen a hadsereg legújabb GPS-vezérlőrendszere...

MA 07:36

Az új ASR-modell kiváltja a méregdrága feliratozó API-kat

A cégek, amelyek hangvezérelt munkafolyamatokat akarnak létrehozni, eddig két rossz közül választhattak: vagy megbízható, de zárt és adatvédelmi szempontból kockázatos API-kat, vagy nyílt, de – a telepítés rugalmasságáért cserébe – pontatlanabb modelleket...

MA 07:29

A nők ismét átvették a vezetést az amerikai munkaerőpiacon

💪 Jellemző példa, hogy évtizedeken át makacs nemi szakadék uralta a foglalkoztatást, noha a nők már régóta többen szereznek diplomát, mint a férfiak...

MA 07:22

A sertések ihlette forradalmi terápia a szemrák ellen

A szem hátsó részén kialakuló ritka daganattípus kezelésére most egészen szokatlan megoldással álltak elő: sertés ondójából származó molekulák segítségével juthat el a kemoterápia a nehezen hozzáférhető területekre...

MA 07:15

A hackerek már lecsaptak az új Citrix-sebezhetőségre

A Citrix NetScaler ADC és NetScaler Gateway rendszerekben súlyos biztonsági rést fedeztek fel, amelyet a hackerek aktívan kihasználnak érzékeny adatok megszerzéséhez...

MA 07:09

Az MI-ügynökök már-már kártevőként működnek

Érdemes megvizsgálni, milyen veszélyeket hordoznak az MI-ügynökök, és miként kezelhetők biztonságosan egy olyan világban, ahol a vállalatok egyre bátrabban vetik be őket...

MA 07:01

Az újranyitás után is maradnak a kígyózó reptéri sorok

🛫 Életbe lépett az a döntés, amelynek nyomán a Közlekedésbiztonsági Hivatal dolgozói visszakapják fizetésüket, véget vetve ezzel a csaknem hathetes leállásnak...

MA 06:58

A legújabb Meta-botrány: szerzői diadal, a torrentezés árnyéka

Ebből következően érdemes megérteni, hogy a Meta egyre súlyosabb szerzői jogi perekbe keveredett azzal kapcsolatban, ahogyan a tartalmakat torrent­hálózatokon keresztül kezeli...

MA 06:50

Az SSD-óriás: 246 TB egyetlen DapuStor-meghajtóban

Első pillantásra úgy tűnt, hogy a tárhelybővítés alapjait írják újra, amikor a DapuStor kihozta legújabb, Roealsen6 R6060 nevű SSD-jét...

MA 06:43

A Google Drive új trükkjei megmenthetik fájljaidat zsarolóvírus-támadáskor

🔒 Érdemes megérteni, hogy napjainkban a felhőalapú tárolás sem jelent automatikus védelmet a zsarolóvírusok ellen, amelyek még mindig komoly veszélyt jelentenek...

MA 06:36

A régebbi Samsungok már tudják az Apple-féle fájlmegosztást – vagy mégsem?

A Samsung mostanság igencsak rákapcsolt: hamarosan már a régebbi Galaxy készülékeken is elérhető lesz az a menő fájlmegosztási funkció, ami eddig csak az új csúcsmodelleken futott...

MA 06:29

Az erőre kapó kínai ipar felforgatja a világpiacot

Márciusban a kínai gyártás teljesítménye egy éve a legnagyobb ütemben nőtt, miközben a gyárak az ünnepek után új lendületet vettek...

MA 06:22

Az olcsó PC-k éve jön, mégis zuhanhatnak az eladások Amerikában

📈 Az Egyesült Államok PC-piacát idén komoly visszaesés sújtja: a kiszállított mennyiség várhatóan 13 százalékkal csökken, a folytatódó memória- és adattárolóválság miatt...

MA 06:15

A Sora eltűnt, de máris özönlenek az új MI‑videókészítők

📺 Az internetes közösséget alaposan meglepte, amikor az OpenAI szinte egyik napról a másikra leállította a népszerű Sora nevű MI‑videógeneráló eszközét...

MA 06:08

Az új Cicada-variáns: tényleg van okunk aggódni?

🐛 Érdemes tudni, hogy az Egyesült Államokban felbukkant a Cicada névre keresztelt, új COVID-variáns, amelyet először 2024 novemberében Dél-Afrikában azonosítottak...

MA 06:05

Történelmi események a mai napon (Március 31.)

Mi történt ezen a napon? Háborúk, birodalmi fordulópontok és tudományos mérföldkövek egyaránt kötődnek ehhez a naphoz: az Alhambra-rendelettől a Hold körüli első űrszondáig, a bostoni kikötő lezárásától a Dalai Láma meneküléséig...

MA 06:01

Az Apple végre leszámol a parancssoros átverésekkel

Jól példázza a jelenséget, hogy sok rutinos Mac-felhasználó is áldozatul eshet egy egyszerű, de alattomos trükknek: a ClickFixnek nevezett módszernél csalók ráveszik az áldozatot, hogy rosszindulatú parancsokat illesszen be a Terminálba...

hétfő 21:33

A Microsoft kutatói asszisztense már két mesterséges aggyal vitázik egyszerre

Hoppá, a Microsoft 365 Copilot Researcher most igazán felturbózza a kutatást – nem vacakol már egyetlen MI-modellel, hanem összetereli az OpenAI-féle ChatGPT-t és az Anthropic Claude-ját, hogy együtt dolgozzanak helyetted...

hétfő 21:12

Az F5 BIG‑IP új sebezhetősége célkeresztben: támadják a vállalati rendszereket

🛡 Az F5 Networks kritikus biztonsági rést tárt fel a népszerű BIG-IP Access Policy Manager eszközben, amit hackerek már aktívan ki is használnak...

hétfő 21:03

Az antivírusok 2026-os csatája: két favorit harcol az elsőségért

A digitális világ mindennapjaiban egyre fontosabbá válik, hogy személyes adataink, képek, üzleti dokumentumok, jelszavak és online fizetési információk megfelelő védelmet kapjanak...

hétfő 20:57

Az Apple 50 éve: forradalmak, botrányok, eltűnt kedvencek

💻 Ötven éve jelent meg az első Apple-termék, azóta a világ egyik legbefolyásosabb techvállalata lett...

hétfő 20:34

A természet igazi tolvajai: kígyók, akik mérget lopnak zsákmányukból

Külön említést érdemel, hogy a vörösnyakú vízisikló (Rhabdophis subminiatus) nem saját maga termeli toxikus, sárga váladékát, hanem az elfogyasztott mérgező varangyokból szerzi...