2025. 02. 28., 13:29

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!
Az Inception Labs csütörtökön mutatta be új AI nyelvi modelljét, amely diffúziós technikákat használ a szövegek hagyományos modellekhez képest gyorsabb létrehozására. Míg a hagyományos modellek szóról szóra építik fel a szöveget, a Mercury-hez hasonló diffúziós alapú modellek teljes válaszokat generálnak egyszerre, egy kezdetben maszkolt állapotból finomítva azokat összefüggő szöveggé. Ez jelentős előrelépést jelent az AI-alapú szöveggenerálás területén, ahol a sebesség kritikus tényező lehet a gyakorlati alkalmazások során.

Hagyományos vs. diffúziós modellek: Az új megközelítés

A hagyományos nagy nyelvi modellek balról jobbra építik a szöveget, egyszerre csak egy tokent (szövegegységet) feldolgozva. Az “autoregresszió” nevű technikát használják, ahol minden szónak meg kell várnia az összes előző szót, mielőtt megjelenne. A képgenerálási modellektől inspirálva, a szöveg diffúziós nyelvi modellek, mint a LLaDA (amelyet a Renmin Egyetem és az Ant Group kutatói fejlesztettek) és a Mercury maszkolás-alapú megközelítést használnak. Ezek a modellek teljesen elzajosított tartalommal kezdenek, és fokozatosan “zajtalanítják” a kimenetet, így egyidejűleg fedik fel a válasz minden részét, nem pedig sorban.

Míg a kép diffúziós modellek folyamatos zajt adnak a pixelértékekhez, a szöveg diffúziós modellek nem tudnak folyamatos zajt alkalmazni a diszkrét tokenekre (szövegadatok darabjaira). Ehelyett speciális maszk tokenekkel helyettesítik őket, ami a szöveges megfelelője a zajnak. A LLaDA esetében a maszkolási valószínűség szabályozza a zaj szintjét, ahol a magas maszkolás magas zajt, az alacsony maszkolás pedig alacsony zajt jelent. A diffúziós folyamat a magas zajtól az alacsony zaj felé halad. Bár a LLaDA ezt maszkolási terminológiával írja le, a Mercury pedig zajterminológiát használ, mindkettő hasonló koncepciót alkalmaz a szöveggenerálásra, amely a diffúzióban gyökerezik.

Hogyan készülnek a szöveg diffúziós modellek?

A képszintézis-modellek létrehozásához hasonlóan a kutatók úgy építik fel a szöveg diffúziós modelleket, hogy neurális hálózatot tanítanak részlegesen elhomályosított adatokon, a modellel megjósoltatják a legvalószínűbb befejezést, majd összehasonlítják az eredményeket a tényleges válasszal. Ha a modell helyesen válaszol, a neurális hálózat azon kapcsolatai, amelyek a helyes válaszhoz vezettek, megerősödnek. Elegendő példa után a modell olyan kimeneteket tud generálni, amelyek elég valószerűek ahhoz, hogy hasznosak legyenek például programozási feladatokhoz.

Az Inception Labs szerint megközelítésük lehetővé teszi a modell számára, hogy finomítsa a kimeneteket és kezelje a hibákat, mivel nem korlátozódik csak a korábban generált szöveg figyelembevételére. Ez a párhuzamos feldolgozás teszi lehetővé a Mercury állítólagos 1000+ token/másodperces generálási sebességét.

Teljesítmény és sebesség: Lenyűgöző számok

Ezek a diffúziós modellek gyorsabban vagy hasonlóan teljesítenek a hasonló méretű hagyományos modellekhez képest. A LLaDA kutatói szerint 8 milliárd paraméteres modelljük a GPT-3-hoz hasonlóan teljesít különféle teljesítménymérések során, versenyképes eredményekkel olyan feladatokban, mint az MMLU, ARC és GSM8K.

Ugyanakkor, a Mercury drámai sebességnövekedést mutat. Mercury Coder Mini modelljük 88,0 százalékot ér el a HumanEval-on és 77,1 százalékot az MBPP-n – a GPT-4o-hoz hasonlóan –, miközben állítólag 1109 token/másodperc sebességgel működik, szemben a GPT-4o Mini 59 token/másodperces sebességével. Ez körülbelül 19-szeres sebességelőnyt jelent a GPT-4o Mini-vel szemben, miközben hasonló teljesítményt nyújt a kódolási teljesítményméréseken.

A Mercury dokumentációja szerint modelljei “több mint 1000 token/másodperces sebességgel futnak Nvidia H100-asokon, ami korábban csak egyedi chipekkel” volt lehetséges olyan specializált hardvergyártóktól, mint a Groq, a Cerebras és a SambaNova. Más sebességre optimalizált modellekkel összehasonlítva a feltételezett előny továbbra is jelentős – a Mercury Coder Mini állítólag körülbelül 5,5-ször gyorsabb, mint a Gemini 2.0 Flash-Lite (201 token/másodperc) és 18-szor gyorsabb, mint a Claude 3.5 Haiku (61 token/másodperc).


Új határok a nagy nyelvi modellek világában

A diffúziós modellek azonban néhányújabb kompromisszumra kényszerülnek . Általában több előremeneteli áthaladást (feldolgozási ciklust) igényelnek a hálózaton keresztül egy teljes válasz generálásához, szemben a hagyományos modellekkel, amelyeknek csak egy menet szükséges tokenenként. Mivel azonban a diffúziós modellek párhuzamosan dolgozzák fel az összes tokent, ezen többletmunka ellenére is nagyobb áteresztőképességet érnek el.

Az Inception szerint a sebességelőny hatással lehet a kódkiegészítő eszközökre, ahol az azonnali válasz befolyásolhatja a fejlesztői termelékenységet, a társalgási AI alkalmazásokra, az erőforrás-korlátozott környezetekre, például a mobilalkalmazásokra, és az AI-ügynökökre, amelyeknek gyorsan kell reagálniuk.

Ha a diffúzió-alapú nyelvi modellek megőrzik a minőséget a sebesség javítása mellett, megváltoztathatják az AI szöveggenerálás fejlődését. Eddig az AI-kutatók nyitottak voltak az új megközelítésekre.

Néhány kérdés fennmarad

Továbbra is kérdéses, hogy a nagyobb diffúziós modellek képesek-e felvenni a versenyt olyan modellekkel, mint a GPT-4o és a Claude 3.7 Sonnet, megbízható eredményeket tudnak-e produkálni sok konfabuláció nélkül, és hogy a megközelítés képes-e kezelni az egyre összetettebb szimulált gondolkodási feladatokat. Egyelőre ezek a modellek alternatívát kínálhatnak a kisebb AI nyelvi modellek számára, amelyek nem áldozzák fel a képességet a sebesség érdekében.

  • Te hogyan értékeled az alternatív architektúrák kísérletezését a transzformereken túl?
  • Mit gondolsz, a diffúziós modellek milyen hatással lehetnek a jövőbeli AI fejlesztésekre?
  • Te hogy érzel az AI szöveggenerálás fejlődésével kapcsolatos gyors technológiai változásokról?


Legfrissebb posztok

MA 08:19

A Hasbro MI-hangja kinyírja a nosztalgiát: Optimus Prime és Mr. Krumplifej

A Hasbro újabb lendülettel lépett be a digitális korszakba: a játékgyártó mostantól interaktív MI-élményekkel ruházza fel legismertebb karaktereit...

MA 08:01

A mesterséges intelligencia leleplezte a vezető kriptóhálózat óriási hibáját – bankok a következők?

Többek között a Zcash hálózatán talált, négy éve meglévő kritikus hiba kavarta fel a kriptovilág állóvizét...

MA 07:55

Az eddigi legerősebb El Niño jön idén, friss előrejelzés szerint

Az év végére példátlan erejű El Niño-jelenség várható – legalábbis az Európai Középtávú Időjárás-előrejelzési Központ friss jelentése szerint...

MA 07:46

Az MI‑ügynökök munka közben tanulnak — csak nem a teljes csapatodért

Egyre több munkahelyen segítenek MI-ügynökök, mégis gyakran olyan érzésünk lehet, mintha mindenki külön-külön tanítgatná ugyanazokat az eszközöket...

MA 07:37

Az ideális Amazon Fire Stick: melyiket válaszd és miért?

📺 Felmerül a kérdés, hogy érdemes-e beruházni egy Fire TV Stick eszközre...

MA 07:28

A Farkas köztünk 2 végre 2027-ben érkezik hét év után

Hét év telt el a bejelentés óta, de végre kézzelfogható dátumot kapott az A farkas köztünk 2 (The Wolf Among Us 2)...

MA 07:19

A GOG bocsánatot kért náci rúnás hírleveléért

⚠ A GOG rendkívül kellemetlen helyzetbe került, miután egyik hírlevelük tárgysorában egyértelműen felismerhető náci rúnákat használtak...

MA 07:10

Az óriásskorpió hatalmas ollókkal uralta az ősi Brit-szigetek földjét és vizeit

🦂 415 millió évvel ezelőtt a mai Egyesült Királyság területén egy hatalmas skorpió járta a szárazföldet és a vizeket...

MA 07:01

A BlackRock által támogatott Securitize zöld utat kap a New York-i Értéktőzsdére

A BlackRock által támogatott Securitize közelebb került ahhoz, hogy tőzsdén jegyzett vállalat legyen, ugyanis az amerikai értékpapír-felügyelet jóváhagyta azt a kulcsfontosságú beadványt, amely a Cantor Equity Partners II-vel (CEPT) tervezett egyesüléséhez kapcsolódik...

MA 06:55

A Denon Home 400: stílus, tartalom, komoly térhangzás — egy aprósággal

🎧 Amikor egy hangfal egyszerre szól stílusról, funkcionalitásról és élményről, a Denon legújabb otthoni központi egysége igazi figyelemfelkeltő lehet...

MA 06:37

A Microsoft kiszabadult: szuperintelligenciát hajszol OpenAI nélkül

Egy lényeges szempont, hogy a Microsoft mesterségesintelligencia-stratégiája évekig összefonódott az OpenAI-jal kötött, több mint 4 300 milliárd forintot érő gigászi partnerséggel...

MA 06:28

A HP új szörnye letarolja a Windowsos MI‑PC‑ket

💥 A Computex 2026 kiállításon a HP olyan munkaállomásokat mutatott be, amelyek már az új NVIDIA GB300 Grace Blackwell Ultra Desktop Superchipet használják, és minden eddiginél nagyobb teljesítményt kínálnak a Windowsos MI-fejlesztőknek...

MA 06:19

A vérbeli bitcoinisták miért nem pánikolnak a 200 milliárd dolláros zuhanás után?

Érdemes megvizsgálni, miért fogadják nyugalommal az elszánt bitcoin-rajongók a bitcoin árfolyamának legutóbbi, 17 százalékos zuhanását, amely egyetlen hét alatt közel 72 ezermilliárd forintnyi piaci értéket törölt el...

MA 06:05

Történelmi események a mai napon (Június 6.)

Mit hozott ez a nap a történelemben? A nap kiemelkedő eseményei között ott van Robert F...

MA 06:01

A kettős csillagok születésének titka: a mágneses mezők?

Az univerzum hatalmas gáz- és porfelhőiben születnek a csillagok. Ezekből a felhőkből kisebb, sűrűbb magok alakulnak ki, majd csillagokká válnak...

péntek 21:56

A bitcoin 60 ezret ostromol, a Dogecoin és Shiba Inu 9%-ot esnek

Egy jelentős eladási hullám a Dogecoint és a Shiba Inut is magával rántotta: mindkettő közel 9 százalékot esett, miközben a bitcoin a 60 000 dolláros szinthez (kb...

péntek 21:23

A legjobban testreszabható, biztonságos VPN mindössze havi 500 forintért

Megemlíthető továbbá, hogy aki teljes irányítást szeretne a biztonságos internetkapcsolata felett, annak a Private Internet Access (PIA) egyedülálló lehetőséget kínál...

péntek 21:12

A tűzpiros Ferrari–HP laptop: 5599 dollár, dedikált GPU nélkül

A HP és a Ferrari közös laptopja első pillantásra igazán menő darab, amely a Monacói Nagydíj előtt, alaposan felturbózva debütál...

péntek 21:01

A főgonosz visszatér: Skeletor még nem mondta az utolsó szót

💀 He-Man legújabb kalandjában a végső összecsapás után úgy tűnik, Skeletor sorsa megpecsételődött: He-Man legyőzi ősi ellenségét, és mindössze egy élettelen koponya marad belőle...

péntek 20:55

A polipok tükrökkel vadásznak a szem elől rejtett zsákmányra

🐙 Többek között a polipokat régóta a tenger legokosabb élőlényei közé sorolják...

péntek 20:45

Az XRP 1,10 dollár felé szakad: kényszerlikvidálás söpri ki a piacot

📈 Az XRP hetek óta tartó gyengélkedése tovább mélyült: viharos eladási hullámban az 1,10 dolláros (kb...

péntek 20:33

A rejtőzködő szupermasszív fekete lyukpárok végre látható jelet adhatnak

A világegyetem legkevésbé ismert jelenségei közé tartoznak a szupermasszív fekete lyuk-párosok, amelyek most új módszerrel válhatnak láthatóvá...

péntek 20:23

A spanyol–angol női vb-selejtező rangadó: hol nézheted ingyen és tévén?

⚽ A világ két legerősebb női focicsapata újra találkozik a 2027-es női világbajnokság selejtezőjén...

péntek 20:01

A 2026-os év nagy égi randevúja: Vénusz és Jupiter szinte összeér

🕌 2026 egyik leglátványosabb égi jelensége vár a csillagkedvelőkre: a két legfényesebb bolygó, a Vénusz és a Jupiter egészen közel látszik majd egymáshoz néhány estén keresztül, mintha szinte összeérnének...

péntek 19:56

Az MSI Strike Alloy víz alatt is működik, 8K-val és rapid triggerrel

🚢 Az MSI legújabb gamer billentyűzete, a Strike Alloy, szinte mindent tud, amit csak elvárhatunk egy modern játékos billentyűzettől...

péntek 19:45

Egy előzetes kutatás szerint az influenza-gyógyszerek fékezhetik a HIV-hez köthető szellemi hanyatlást

Az utóbbi évtizedekben jelentősen javult a HIV-fertőzés kezelése, de még a modern gyógyszerek ellenére is sok fertőzött tapasztal enyhébb fokú mentális hanyatlást, amely megnehezítheti az összpontosítást, a figyelmet vagy a többfeladatos munkát...

péntek 19:34

A Microsoft a Godot mellett: könnyebb Xbox-megjelenés PC-n

🎮 A Microsoft új mintája most először ad lehetőséget a Godot-motor felhasználóinak, hogy könnyebben juttathassák el játékaikat az Xbox-platformra PC-n keresztül...

péntek 19:23

A genetikai ok, amiért sokaknál nem hat az Ozempic

💊 Érdemes megérteni, miért nem mindenkinél működnek látványosan az új, népszerű, vércukorszintet javító gyógyszerek...

péntek 19:12

Az űrállomáson súlyosbodik a légszivárgás: vészmenedékbe vonultak az űrhajósok

🛰 A Nemzetközi Űrállomás orosz szegmensében pénteken egyre súlyosbodó légszivárgás miatt a fedélzeten tartózkodó négy asztronautának – Jessica Meir, Jack Hathaway, Sophie Adenot és Andrey Fedyaev – azonnal szkafandert kellett ölteniük, majd menedéket keresniük a dokkolt Crew Dragon űrhajóban...