2025. 02. 28., 13:29

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!
Az Inception Labs csütörtökön mutatta be új AI nyelvi modelljét, amely diffúziós technikákat használ a szövegek hagyományos modellekhez képest gyorsabb létrehozására. Míg a hagyományos modellek szóról szóra építik fel a szöveget, a Mercury-hez hasonló diffúziós alapú modellek teljes válaszokat generálnak egyszerre, egy kezdetben maszkolt állapotból finomítva azokat összefüggő szöveggé. Ez jelentős előrelépést jelent az AI-alapú szöveggenerálás területén, ahol a sebesség kritikus tényező lehet a gyakorlati alkalmazások során.

Hagyományos vs. diffúziós modellek: Az új megközelítés

A hagyományos nagy nyelvi modellek balról jobbra építik a szöveget, egyszerre csak egy tokent (szövegegységet) feldolgozva. Az “autoregresszió” nevű technikát használják, ahol minden szónak meg kell várnia az összes előző szót, mielőtt megjelenne. A képgenerálási modellektől inspirálva, a szöveg diffúziós nyelvi modellek, mint a LLaDA (amelyet a Renmin Egyetem és az Ant Group kutatói fejlesztettek) és a Mercury maszkolás-alapú megközelítést használnak. Ezek a modellek teljesen elzajosított tartalommal kezdenek, és fokozatosan “zajtalanítják” a kimenetet, így egyidejűleg fedik fel a válasz minden részét, nem pedig sorban.

Míg a kép diffúziós modellek folyamatos zajt adnak a pixelértékekhez, a szöveg diffúziós modellek nem tudnak folyamatos zajt alkalmazni a diszkrét tokenekre (szövegadatok darabjaira). Ehelyett speciális maszk tokenekkel helyettesítik őket, ami a szöveges megfelelője a zajnak. A LLaDA esetében a maszkolási valószínűség szabályozza a zaj szintjét, ahol a magas maszkolás magas zajt, az alacsony maszkolás pedig alacsony zajt jelent. A diffúziós folyamat a magas zajtól az alacsony zaj felé halad. Bár a LLaDA ezt maszkolási terminológiával írja le, a Mercury pedig zajterminológiát használ, mindkettő hasonló koncepciót alkalmaz a szöveggenerálásra, amely a diffúzióban gyökerezik.

Hogyan készülnek a szöveg diffúziós modellek?

A képszintézis-modellek létrehozásához hasonlóan a kutatók úgy építik fel a szöveg diffúziós modelleket, hogy neurális hálózatot tanítanak részlegesen elhomályosított adatokon, a modellel megjósoltatják a legvalószínűbb befejezést, majd összehasonlítják az eredményeket a tényleges válasszal. Ha a modell helyesen válaszol, a neurális hálózat azon kapcsolatai, amelyek a helyes válaszhoz vezettek, megerősödnek. Elegendő példa után a modell olyan kimeneteket tud generálni, amelyek elég valószerűek ahhoz, hogy hasznosak legyenek például programozási feladatokhoz.

Az Inception Labs szerint megközelítésük lehetővé teszi a modell számára, hogy finomítsa a kimeneteket és kezelje a hibákat, mivel nem korlátozódik csak a korábban generált szöveg figyelembevételére. Ez a párhuzamos feldolgozás teszi lehetővé a Mercury állítólagos 1000+ token/másodperces generálási sebességét.

Teljesítmény és sebesség: Lenyűgöző számok

Ezek a diffúziós modellek gyorsabban vagy hasonlóan teljesítenek a hasonló méretű hagyományos modellekhez képest. A LLaDA kutatói szerint 8 milliárd paraméteres modelljük a GPT-3-hoz hasonlóan teljesít különféle teljesítménymérések során, versenyképes eredményekkel olyan feladatokban, mint az MMLU, ARC és GSM8K.

Ugyanakkor, a Mercury drámai sebességnövekedést mutat. Mercury Coder Mini modelljük 88,0 százalékot ér el a HumanEval-on és 77,1 százalékot az MBPP-n – a GPT-4o-hoz hasonlóan –, miközben állítólag 1109 token/másodperc sebességgel működik, szemben a GPT-4o Mini 59 token/másodperces sebességével. Ez körülbelül 19-szeres sebességelőnyt jelent a GPT-4o Mini-vel szemben, miközben hasonló teljesítményt nyújt a kódolási teljesítményméréseken.

A Mercury dokumentációja szerint modelljei “több mint 1000 token/másodperces sebességgel futnak Nvidia H100-asokon, ami korábban csak egyedi chipekkel” volt lehetséges olyan specializált hardvergyártóktól, mint a Groq, a Cerebras és a SambaNova. Más sebességre optimalizált modellekkel összehasonlítva a feltételezett előny továbbra is jelentős – a Mercury Coder Mini állítólag körülbelül 5,5-ször gyorsabb, mint a Gemini 2.0 Flash-Lite (201 token/másodperc) és 18-szor gyorsabb, mint a Claude 3.5 Haiku (61 token/másodperc).


Új határok a nagy nyelvi modellek világában

A diffúziós modellek azonban néhányújabb kompromisszumra kényszerülnek . Általában több előremeneteli áthaladást (feldolgozási ciklust) igényelnek a hálózaton keresztül egy teljes válasz generálásához, szemben a hagyományos modellekkel, amelyeknek csak egy menet szükséges tokenenként. Mivel azonban a diffúziós modellek párhuzamosan dolgozzák fel az összes tokent, ezen többletmunka ellenére is nagyobb áteresztőképességet érnek el.

Az Inception szerint a sebességelőny hatással lehet a kódkiegészítő eszközökre, ahol az azonnali válasz befolyásolhatja a fejlesztői termelékenységet, a társalgási AI alkalmazásokra, az erőforrás-korlátozott környezetekre, például a mobilalkalmazásokra, és az AI-ügynökökre, amelyeknek gyorsan kell reagálniuk.

Ha a diffúzió-alapú nyelvi modellek megőrzik a minőséget a sebesség javítása mellett, megváltoztathatják az AI szöveggenerálás fejlődését. Eddig az AI-kutatók nyitottak voltak az új megközelítésekre.

Néhány kérdés fennmarad

Továbbra is kérdéses, hogy a nagyobb diffúziós modellek képesek-e felvenni a versenyt olyan modellekkel, mint a GPT-4o és a Claude 3.7 Sonnet, megbízható eredményeket tudnak-e produkálni sok konfabuláció nélkül, és hogy a megközelítés képes-e kezelni az egyre összetettebb szimulált gondolkodási feladatokat. Egyelőre ezek a modellek alternatívát kínálhatnak a kisebb AI nyelvi modellek számára, amelyek nem áldozzák fel a képességet a sebesség érdekében.

  • Te hogyan értékeled az alternatív architektúrák kísérletezését a transzformereken túl?
  • Mit gondolsz, a diffúziós modellek milyen hatással lehetnek a jövőbeli AI fejlesztésekre?
  • Te hogy érzel az AI szöveggenerálás fejlődésével kapcsolatos gyors technológiai változásokról?


Legfrissebb posztok

kedd 17:23

Az államkötvény-hozamok milliárdokat szívnak ki a bitcoin ETF-ekből

A kriptovaluták iránti lendület komoly csapást szenvedett el, ahogy a befektetők tömegesen menekítik a pénzüket a bitcoin-alapú tőzsdén kereskedett alapokból...

kedd 17:01

Az évszázad hőhulláma sújtja Európát: újabb halálos áldozatok

Döbbenetesen szokatlan, rendkívüli hőséggel küzd Nyugat-Európa: sorra dőlnek a melegrekordok, miközben egyre többen vesztik életüket a forróság következtében...

kedd 16:35

Az új Bond-játék végre igazi Bond-mozi: lopakodás és robbanások

Üldözések, szuperkütyük és látványos akciópillanatok – a 007 First Light minden eddiginél jobban képes átélhetővé tenni, milyen érzés James Bondként beszivárogni a világ legveszélyesebb színtereire...

kedd 16:23

Az új Ferrari Luce sokkol: Jony Ive védi, egy döntést imádnak

A Ferrari leleplezte története első elektromos autóját, a Lucét, ami máris heves vitákat kavart...

kedd 16:13

A GEEKOM A9 Max (2026) tesztje: mini PC, munkaállomás-erővel

Az asztali méretű, kis helyet foglaló gépek mezőnyében a GEEKOM A9 Max 2026 komoly kihívóként lépett színre...

kedd 15:56

A League of Legends nemet mond a kollab skinek dömpingjére

🔴 Ritka az a népszerű online játék, amely még ellenáll a marketing- és együttműködési őrületnek...

kedd 15:45

Az MMO-knak nem kell 200 óra egyedi tartalommal indulniuk

Az új MMO-k fejlesztése manapság igazi kihívás, hiszen a piacot évtizedes múlttal rendelkező játékok uralják...

kedd 15:34

A StablR befagyasztotta az USDR-t és EURR-t 13,5 milliós támadás után

A StablR, egy máltai stabilcoin-kibocsátó felfüggesztette két fő tokenje, a USDR és az EURR minden műveletét, miután jelentős kibertámadás érte...

kedd 15:23

A bitcoin újra gyengélkedik, az MI-tokenek szárnyalnak

Az utóbbi két hétben jelentős lejtmenet jellemezte a legnagyobb kriptopénzek piacát, miközben a hagyományos tőzsdeindexek, mint az S&P 500 és a Nasdaq 100, stabilan emelkedtek...

kedd 15:12

A Bitcoin sorsa kritikus támasz és opciós csata szorításában

📈 A Bitcoin árfolyama napok óta szűk sávban mozog, méghozzá nem véletlenül...

kedd 15:01

A GTA 6-nak ma kellett volna jönnie: egy szuperfan sorba áll

Ami kezdetben ártalmatlannak tűnt, mostanra a rajongók szemében valódi csalódássá vált: május 26...

kedd 14:34

Az MI nem hoz munkahely-apokalipszist? Altman örül, ha téved

🙂 Felmerül a kérdés, hogy mennyire kell tartanunk a munkahelyek elvesztésétől a mesterséges intelligencia (MI) térnyerése miatt...

kedd 14:23

Egy új szemvizsgálat tű nélkül jelzi a vérszegénységet

👀 A vérszegénység kiszűrését eddig csak vérvétellel tudták megoldani, most azonban egy hihetetlenül innovatív eljárás kerülhet reflektorfénybe...

kedd 14:02

A 2500 éves egyiptomi gyöngyfátyol, amely Ozirisszá változtatja a halottat

Több ezer apró, színes gyöngyből készült halotti lepel került elő Luxorban, amely mintegy 2500 évvel ezelőtt szolgált a halottak túlvilágra való átvezetésének szimbólumaként...

kedd 13:56

Az ergonómia bajnoka: Sihoo Doro C300 Pro V2 teszt

Felmerül a kérdés, hogy mennyit számít egy jó irodai szék a mindennapi munkában...

kedd 13:45

Az óriási szuperszámítógépes szimulációk feltárták a kozmosz mágneses titkát

💫 Fontos kérdés, hogy miért találhatók rendezett, óriási mágneses terek az univerzum minden szegletében – a bolygóktól a csillagokon át egészen a galaxisokig...

kedd 13:23

A Hyperliquid makrogazdasági fogadásokkal támadja a Polymarketet

A Hyperliquid elhozta a való élet eseményeire épülő jóslatokat a decentralizált tőzsdék világába...

kedd 13:12

Mikor érkezik végre a Riválisok 2. évad 5. része Hulu-ra és Disney+-ra?

😱 A Riválisok (Rivals) pimasz második évadából a jelenlegi adagban már csak két epizód van hátra, és az előző részben minden eddiginél többet láthattunk – szó szerint is...

kedd 12:44

A szaúdi NEOM 2030 utánra halasztja a The Line építését

🚧 Különösen igaz ez, ha grandiózus, sci-fibe illő tervekről van szó: Szaúd-Arábia leállította A Vonal (The Line) projekt további munkálatait legalább 2030-ig...

kedd 11:55

A stabilcoinok értéke már 95 ország devizatartalékát is veri

A stabilcoinok piaci értéke mára elérte a 322 milliárd dollárt (kb...

kedd 11:35

Egy ritka genetikai betegség átírja, mit gondolunk az agy félelemközpontjáról

💪 Különösen akkor, ha egy ritka genetikai eltérés világít rá, hogy amit az agytudomány évtizedek óta biztosnak hitt, az lehet, hogy alapjaiban nem igaz...

kedd 11:12

Az Apple új Star Cityje teljesen más, mint Az egész emberiségért

Érdekes felvetés, hogy egy alkotógárda akár két teljesen eltérő sci-fi sorozatot is le tud tenni az asztalra, miközben a témájuk első pillantásra nagyon hasonlónak tűnik...

kedd 11:01

Az XRP 1,35 alá esik: 1,30-nál dőlhet el minden

Erre példa, amikor egy kriptovaluta hetekig alig mozdul, majd hirtelen elindul a lejtőn: az XRP árfolyama már harmadszor pattant le a fontos 1,36 dolláros ellenállásról, így a bikák lendülete megtört, és a jegyzés most az 1,35 dolláros szint alá süllyedt...

kedd 10:55

Az MI-adósságok csendben átrajzolják a vállalati kockázati térképet

Egy lényeges szempont, hogy az elmúlt húsz évben a technikai adósság leginkább elavult rendszereket, zűrzavaros programkódot és elhanyagolt dokumentációt jelentett...

kedd 10:46

A Mars parittyaként hajítja a NASA Psyche-t a rejtélyes fémvilág felé

Ebből következően érdemes megérteni, hogy a NASA Psyche űrszondája meghatározó mérföldkőhöz ért: sikeresen kihasználta a Mars gravitációját, hogy lendületet kapjon és megfelelő irányba álljon a kisbolygóövben keringő titokzatos, fémben gazdag Psyche aszteroida felé...

kedd 10:37

Váratlanul meghalt Nathan Allman, az Ondo Finance alapítója

Egy egész iparág meglepő hírre ébredt: Nathan Allman, az Ondo Finance alapítója és vezérigazgatója váratlanul elhunyt...

kedd 10:28

A Jupiteren túl rejtélyes gyűrűben bolygógyárra bukkantak a tudósok

4,6 milliárd éve a Napot masszív gáz- és porlemez vette körül, amelyből először apró porszemek születtek, majd ezekből bonyolult ütközések és összetapadások révén kialakultak a bolygókezdemények...

kedd 10:19

A Derelict Star, az űrplatformer, amely Jonathan Blow-nál is kiverte a biztosítékot

🚀 Az indie platformerek piacán időnként felbukkan egy-egy olyan játék, amely képes megosztani még a műfaj legnagyobb rajongóit is...

kedd 10:01

A bab és a szója akár 30%-kal mérsékelheti a magas vérnyomás kockázatát

Egy lényeges szempont, hogy az étkezési szokásaink drasztikusan befolyásolják a magas vérnyomás kialakulásának kockázatát...