2025. 02. 28., 13:29

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!
Az Inception Labs csütörtökön mutatta be új AI nyelvi modelljét, amely diffúziós technikákat használ a szövegek hagyományos modellekhez képest gyorsabb létrehozására. Míg a hagyományos modellek szóról szóra építik fel a szöveget, a Mercury-hez hasonló diffúziós alapú modellek teljes válaszokat generálnak egyszerre, egy kezdetben maszkolt állapotból finomítva azokat összefüggő szöveggé. Ez jelentős előrelépést jelent az AI-alapú szöveggenerálás területén, ahol a sebesség kritikus tényező lehet a gyakorlati alkalmazások során.

Hagyományos vs. diffúziós modellek: Az új megközelítés

A hagyományos nagy nyelvi modellek balról jobbra építik a szöveget, egyszerre csak egy tokent (szövegegységet) feldolgozva. Az “autoregresszió” nevű technikát használják, ahol minden szónak meg kell várnia az összes előző szót, mielőtt megjelenne. A képgenerálási modellektől inspirálva, a szöveg diffúziós nyelvi modellek, mint a LLaDA (amelyet a Renmin Egyetem és az Ant Group kutatói fejlesztettek) és a Mercury maszkolás-alapú megközelítést használnak. Ezek a modellek teljesen elzajosított tartalommal kezdenek, és fokozatosan “zajtalanítják” a kimenetet, így egyidejűleg fedik fel a válasz minden részét, nem pedig sorban.

Míg a kép diffúziós modellek folyamatos zajt adnak a pixelértékekhez, a szöveg diffúziós modellek nem tudnak folyamatos zajt alkalmazni a diszkrét tokenekre (szövegadatok darabjaira). Ehelyett speciális maszk tokenekkel helyettesítik őket, ami a szöveges megfelelője a zajnak. A LLaDA esetében a maszkolási valószínűség szabályozza a zaj szintjét, ahol a magas maszkolás magas zajt, az alacsony maszkolás pedig alacsony zajt jelent. A diffúziós folyamat a magas zajtól az alacsony zaj felé halad. Bár a LLaDA ezt maszkolási terminológiával írja le, a Mercury pedig zajterminológiát használ, mindkettő hasonló koncepciót alkalmaz a szöveggenerálásra, amely a diffúzióban gyökerezik.

Hogyan készülnek a szöveg diffúziós modellek?

A képszintézis-modellek létrehozásához hasonlóan a kutatók úgy építik fel a szöveg diffúziós modelleket, hogy neurális hálózatot tanítanak részlegesen elhomályosított adatokon, a modellel megjósoltatják a legvalószínűbb befejezést, majd összehasonlítják az eredményeket a tényleges válasszal. Ha a modell helyesen válaszol, a neurális hálózat azon kapcsolatai, amelyek a helyes válaszhoz vezettek, megerősödnek. Elegendő példa után a modell olyan kimeneteket tud generálni, amelyek elég valószerűek ahhoz, hogy hasznosak legyenek például programozási feladatokhoz.

Az Inception Labs szerint megközelítésük lehetővé teszi a modell számára, hogy finomítsa a kimeneteket és kezelje a hibákat, mivel nem korlátozódik csak a korábban generált szöveg figyelembevételére. Ez a párhuzamos feldolgozás teszi lehetővé a Mercury állítólagos 1000+ token/másodperces generálási sebességét.

Teljesítmény és sebesség: Lenyűgöző számok

Ezek a diffúziós modellek gyorsabban vagy hasonlóan teljesítenek a hasonló méretű hagyományos modellekhez képest. A LLaDA kutatói szerint 8 milliárd paraméteres modelljük a GPT-3-hoz hasonlóan teljesít különféle teljesítménymérések során, versenyképes eredményekkel olyan feladatokban, mint az MMLU, ARC és GSM8K.

Ugyanakkor, a Mercury drámai sebességnövekedést mutat. Mercury Coder Mini modelljük 88,0 százalékot ér el a HumanEval-on és 77,1 százalékot az MBPP-n – a GPT-4o-hoz hasonlóan –, miközben állítólag 1109 token/másodperc sebességgel működik, szemben a GPT-4o Mini 59 token/másodperces sebességével. Ez körülbelül 19-szeres sebességelőnyt jelent a GPT-4o Mini-vel szemben, miközben hasonló teljesítményt nyújt a kódolási teljesítményméréseken.

A Mercury dokumentációja szerint modelljei “több mint 1000 token/másodperces sebességgel futnak Nvidia H100-asokon, ami korábban csak egyedi chipekkel” volt lehetséges olyan specializált hardvergyártóktól, mint a Groq, a Cerebras és a SambaNova. Más sebességre optimalizált modellekkel összehasonlítva a feltételezett előny továbbra is jelentős – a Mercury Coder Mini állítólag körülbelül 5,5-ször gyorsabb, mint a Gemini 2.0 Flash-Lite (201 token/másodperc) és 18-szor gyorsabb, mint a Claude 3.5 Haiku (61 token/másodperc).


Új határok a nagy nyelvi modellek világában

A diffúziós modellek azonban néhányújabb kompromisszumra kényszerülnek . Általában több előremeneteli áthaladást (feldolgozási ciklust) igényelnek a hálózaton keresztül egy teljes válasz generálásához, szemben a hagyományos modellekkel, amelyeknek csak egy menet szükséges tokenenként. Mivel azonban a diffúziós modellek párhuzamosan dolgozzák fel az összes tokent, ezen többletmunka ellenére is nagyobb áteresztőképességet érnek el.

Az Inception szerint a sebességelőny hatással lehet a kódkiegészítő eszközökre, ahol az azonnali válasz befolyásolhatja a fejlesztői termelékenységet, a társalgási AI alkalmazásokra, az erőforrás-korlátozott környezetekre, például a mobilalkalmazásokra, és az AI-ügynökökre, amelyeknek gyorsan kell reagálniuk.

Ha a diffúzió-alapú nyelvi modellek megőrzik a minőséget a sebesség javítása mellett, megváltoztathatják az AI szöveggenerálás fejlődését. Eddig az AI-kutatók nyitottak voltak az új megközelítésekre.

Néhány kérdés fennmarad

Továbbra is kérdéses, hogy a nagyobb diffúziós modellek képesek-e felvenni a versenyt olyan modellekkel, mint a GPT-4o és a Claude 3.7 Sonnet, megbízható eredményeket tudnak-e produkálni sok konfabuláció nélkül, és hogy a megközelítés képes-e kezelni az egyre összetettebb szimulált gondolkodási feladatokat. Egyelőre ezek a modellek alternatívát kínálhatnak a kisebb AI nyelvi modellek számára, amelyek nem áldozzák fel a képességet a sebesség érdekében.

  • Te hogyan értékeled az alternatív architektúrák kísérletezését a transzformereken túl?
  • Mit gondolsz, a diffúziós modellek milyen hatással lehetnek a jövőbeli AI fejlesztésekre?
  • Te hogy érzel az AI szöveggenerálás fejlődésével kapcsolatos gyors technológiai változásokról?


Legfrissebb posztok

MA 16:12

A feltételezett hajórobbanás Miami Beachen: tizenegy sérült

Életveszélyes helyzet alakult ki szombat délután a Miami környéki Haulover Beach Marina közelében, amikor egy csónak vélhetően felrobbant a vízen...

MA 15:56

Az Apollo–12 feloldott képei: UFO-k a Hold felett?

🛸 Évtizedekkel azután, hogy az Apollo–12 legénysége másodikként lépett a Holdra 1969 novemberében, a küldetés újra reflektorfénybe került...

MA 15:46

Az új, magyarázhatatlan rozsdamentes acél sokkolja a kutatókat

🤯 Jellemző példa, hogy a zöld hidrogén gyártása egyre inkább kulcsfontosságú szerepet kap az energiaiparban, mégis számos technológiai akadályba ütközik...

MA 15:34

A kriptoipar ünnepel: megvan a Clarity Act szenátusi időpontja

🎉 Egy lényeges szempont, hogy az amerikai szenátus hamarosan napirendre tűzi a digitális pénzeszközök piacának szabályozását érintő törvénytervezetet...

MA 15:23

A hosszú élet génje: sikeres génátvitel, hosszabb élettartam

👨‍🔬 Egérkísérletekkel sikerült átültetni egy rendkívül hosszú élethez kapcsolódó gént, amelyet a különleges biológiájú pucér vakondpatkányoktól vettek át a kutatók...

MA 15:12

Az új Two Point Museum DLC: építhető stúdió, milliónyi alkotás, MI nélkül

Fontos szempont, hogy a Two Point Museum legújabb kiegészítője, az Arty Facts DLC egy különleges műteremmel bővíti a játékot, ahol a művészek szinte végtelen számú egyedi alkotást készíthetnek – mindezt generatív MI használata nélkül...

MA 15:03

A halalflációval dacolnak New York utcai árusai

Tamer Hassan több mint tíz éve dolgozik az utcai ételes kocsik világában Manhattan szívében, a Times Square közelében...

MA 14:57

Az agyi képalkotás megdöbbentő különbséget mutat a pszichopaták és mások között

👀 A pszichopátiát mindig is különleges, nehezen megfejthető személyiségjegyként tartották számon, de most a tudomány közelebb jutott a titokhoz: kiderült, hogy a pszichopaták agyában egy meghatározott terület, a striátum, átlagosan 10 százalékkal nagyobb, mint más embereknél...

MA 14:45

A James Webb egy fekete lyukkal fejtheti meg a „vörös pöttyök” titkát

💫 A James Webb Űrteleszkóp újabb szenzációs felfedezést tett: egy olyan fekete lyukat azonosított és vizsgált, amelynek tanulmányozása közelebb vihet a korai univerzum titokzatos, kis vörös pontjainak megfejtéséhez...

MA 14:23

Az új Rust-frissítés mozsarakat hoz, vizuális irányzék nélkül jön a káosz

Már megszokhattuk, hogy Rustban minden hónap egy újabb fordulatot hoz, legyen szó a bázis kirablásáról vagy egy váratlan rendszerfrissítésről...

MA 12:57

A Division Resurgence bizonyít: mobilon is tarol a looter-shooter

👑 A nagy konzolos és PC-s sikerszériák közül kevés mondhatja el magáról, hogy ilyen elegánsan debütált mobilon, mint a Tom Clancy: A Division – Resurgence (Tom Clancy’s The Division: Resurgence)...

MA 12:35

A BenQ RD280UG tesztje: a 3:2 újra menő, szuper világítással

💡 Régen nem volt akkora öröm monitor elé ülni, mint most ezzel a panellel...

MA 12:23

Az ember közelebbi rokona a macska vagy a kutya?

Különösen érdekes kérdés, hogy vajon az emberek közelebb állnak-e a macskákhoz vagy a kutyákhoz — végül is mindkét faj uralja a mindennapjainkat, szoros kapcsolatban élnek velünk, közös ágyon alszunk velük, néha pedig az ételünkből is csippentenek...

MA 11:12

Így lesz a lakásodból okosotthon 110 ezer forintból

💡 Különösen igaz ez akkor, ha elavult lakásodat szívesen cserélnéd egy korszerűbb, kényelmesebb otthonra – anélkül, hogy elköltöznél vagy vagyonokat költenél...

MA 10:57

Az amerikai sportfogadás pénzügyi termék, nem szerencsejáték – állítja egy új szereplő

A sportfogadás évek óta a szerencsejátékok világához tartozik, de egyes szakemberek szerint ideje lenne másként tekinteni rá...

MA 10:50

A következő Sötétség Világa játék vérfarkasos metroidvania – le a kalappal

Egy új videojáték készül a Sötétség Világa (World of Darkness) univerzumban, de ezúttal nem klasszikus szerepjáték, hanem valami teljesen más: egy metroidvania stílusú akciójáték...

MA 10:43

A fekete humor nagyágyúi: ezek letaszítják a Viszályt

💀 Készen állsz egy új adag sötét komédiára? Ha már ledaráltad a Viszály (Beef) második évadát, nem vagy egyedül...

MA 10:29

A titkos agyi kapcsoló, amely megálljt parancsol a vakarózásnak

🤔 Egy új felfedezés szerint testünk egy láthatatlan idegi jel segítségével szabályozza, mikor fejezzük be a vakarózást...

MA 10:22

Az Old Firm-derbit így nézheted élőben: ingyen és tévében

📺 A legendás glasgow-i Old Firm-derbi hamarosan újra lázba hozza a futballrajongókat, hiszen idén minden korábbinál feszültebben alakul a skóciai bajnoki címért zajló küzdelem...

MA 09:30

A Dexter: Resurrection 2-ben két sorozatgyilkos borítja fel New Yorkot

😈 Érdemes megvizsgálni, miként folytatódik a Dexter: Feltámadás (Dexter: Resurrection) története, amely most elhozta a rajongóknak azt, amire régóta vártak: izgalmas visszatérést és még sötétebb fejezeteket...

MA 09:15

Az Atlanti-óceán létfontosságú áramlása gyengül – a világ megérzi

Az Atlanti-óceán egyik legfontosabb, éghajlatot szabályozó áramlata mérhetően lassul, és ez hatással lehet az egész világ időjárására...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 5/10

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Thankful: Gratitude Journal (iPhone/iPad)A Thankful egy letisztult, esztétikus napló, amely segít a hála mindennapi gyakorlásában...

MA 09:08

Az édesgyökér egyik vegyülete ígéretes a gyulladásos bélbetegség ellen

🌿 Az édesgyökérben található glicirizin nevű természetes vegyület új reményt hozhat azok számára, akik gyulladásos bélbetegségben (IBD) szenvednek...

MA 09:02

A tudósok döbbenten figyelik: vulkáni felhő zabálja a légköri metánt

2022 januárjában a Dél-Csendes-óceán mélyén fekvő Hunga Tonga–Hunga Ha’apai víz alatti vulkán kitörése nemcsak a modern idők egyik legnagyobb természeti katasztrófáját jelentette, hanem a tudósokat meglepő légköri folyamatokra is fényt derített...

MA 08:50

A halál torkában: füst és pánik a denveri Frontier-gépen

Sokan tartanak attól, hogy repülőgépen ülve a legrosszabb történhet, és Denverben mindez valóra vált egy péntek éjszakai járaton...

MA 08:36

Az Antarktisz alulról olvad – a helyzet a vártnál is rosszabb

🌊 A legfrissebb kutatások szerint a globális tengerszint-emelkedés jóval gyorsabb lehet, mint korábban gondolták a tudósok, mivel az Antarktiszon lévő jégtáblák minden eddiginél intenzívebben olvadnak alulról...

MA 08:22

A Riven társalkotója megvédi az MI-művészetet, visszavág a kritikusoknak

Robyn Miller, a Myst és a Riven videojátékok legendás alkotója újra a figyelem középpontjába került a Riven hanganyagának különleges vinilkiadásával, amelyhez ő maga készítette a lemezborító képeit...

MA 08:01

A bitcoin- és CRO-bukta 406 milliós lyukat üt a Trump Medián

A Trump Media & Technology Group jelentős, 147 milliárd forintos (405,9 millió dolláros) első negyedéves veszteséget könyvelt el, miközben bevétele mindössze 307 millió forint (871 200 dollár) volt...

MA 07:50

A Crimson Desert új mércét állít az MMO-frissítésekben

Érdemes kiemelni, hogy a Crimson Desert egyjátékos RPG-ként indul, de fejlesztési tempója és folyamatos frissítései alapján könnyen összetéveszthető egy élő szolgáltatásként működő MMO-val...