2025. 02. 28., 13:29

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!

Újfajta nyelvi mesterséges intelligencia: induljunk ki a zajból!
Az Inception Labs csütörtökön mutatta be új AI nyelvi modelljét, amely diffúziós technikákat használ a szövegek hagyományos modellekhez képest gyorsabb létrehozására. Míg a hagyományos modellek szóról szóra építik fel a szöveget, a Mercury-hez hasonló diffúziós alapú modellek teljes válaszokat generálnak egyszerre, egy kezdetben maszkolt állapotból finomítva azokat összefüggő szöveggé. Ez jelentős előrelépést jelent az AI-alapú szöveggenerálás területén, ahol a sebesség kritikus tényező lehet a gyakorlati alkalmazások során.

Hagyományos vs. diffúziós modellek: Az új megközelítés

A hagyományos nagy nyelvi modellek balról jobbra építik a szöveget, egyszerre csak egy tokent (szövegegységet) feldolgozva. Az “autoregresszió” nevű technikát használják, ahol minden szónak meg kell várnia az összes előző szót, mielőtt megjelenne. A képgenerálási modellektől inspirálva, a szöveg diffúziós nyelvi modellek, mint a LLaDA (amelyet a Renmin Egyetem és az Ant Group kutatói fejlesztettek) és a Mercury maszkolás-alapú megközelítést használnak. Ezek a modellek teljesen elzajosított tartalommal kezdenek, és fokozatosan “zajtalanítják” a kimenetet, így egyidejűleg fedik fel a válasz minden részét, nem pedig sorban.

Míg a kép diffúziós modellek folyamatos zajt adnak a pixelértékekhez, a szöveg diffúziós modellek nem tudnak folyamatos zajt alkalmazni a diszkrét tokenekre (szövegadatok darabjaira). Ehelyett speciális maszk tokenekkel helyettesítik őket, ami a szöveges megfelelője a zajnak. A LLaDA esetében a maszkolási valószínűség szabályozza a zaj szintjét, ahol a magas maszkolás magas zajt, az alacsony maszkolás pedig alacsony zajt jelent. A diffúziós folyamat a magas zajtól az alacsony zaj felé halad. Bár a LLaDA ezt maszkolási terminológiával írja le, a Mercury pedig zajterminológiát használ, mindkettő hasonló koncepciót alkalmaz a szöveggenerálásra, amely a diffúzióban gyökerezik.

Hogyan készülnek a szöveg diffúziós modellek?

A képszintézis-modellek létrehozásához hasonlóan a kutatók úgy építik fel a szöveg diffúziós modelleket, hogy neurális hálózatot tanítanak részlegesen elhomályosított adatokon, a modellel megjósoltatják a legvalószínűbb befejezést, majd összehasonlítják az eredményeket a tényleges válasszal. Ha a modell helyesen válaszol, a neurális hálózat azon kapcsolatai, amelyek a helyes válaszhoz vezettek, megerősödnek. Elegendő példa után a modell olyan kimeneteket tud generálni, amelyek elég valószerűek ahhoz, hogy hasznosak legyenek például programozási feladatokhoz.

Az Inception Labs szerint megközelítésük lehetővé teszi a modell számára, hogy finomítsa a kimeneteket és kezelje a hibákat, mivel nem korlátozódik csak a korábban generált szöveg figyelembevételére. Ez a párhuzamos feldolgozás teszi lehetővé a Mercury állítólagos 1000+ token/másodperces generálási sebességét.

Teljesítmény és sebesség: Lenyűgöző számok

Ezek a diffúziós modellek gyorsabban vagy hasonlóan teljesítenek a hasonló méretű hagyományos modellekhez képest. A LLaDA kutatói szerint 8 milliárd paraméteres modelljük a GPT-3-hoz hasonlóan teljesít különféle teljesítménymérések során, versenyképes eredményekkel olyan feladatokban, mint az MMLU, ARC és GSM8K.

Ugyanakkor, a Mercury drámai sebességnövekedést mutat. Mercury Coder Mini modelljük 88,0 százalékot ér el a HumanEval-on és 77,1 százalékot az MBPP-n – a GPT-4o-hoz hasonlóan –, miközben állítólag 1109 token/másodperc sebességgel működik, szemben a GPT-4o Mini 59 token/másodperces sebességével. Ez körülbelül 19-szeres sebességelőnyt jelent a GPT-4o Mini-vel szemben, miközben hasonló teljesítményt nyújt a kódolási teljesítményméréseken.

A Mercury dokumentációja szerint modelljei “több mint 1000 token/másodperces sebességgel futnak Nvidia H100-asokon, ami korábban csak egyedi chipekkel” volt lehetséges olyan specializált hardvergyártóktól, mint a Groq, a Cerebras és a SambaNova. Más sebességre optimalizált modellekkel összehasonlítva a feltételezett előny továbbra is jelentős – a Mercury Coder Mini állítólag körülbelül 5,5-ször gyorsabb, mint a Gemini 2.0 Flash-Lite (201 token/másodperc) és 18-szor gyorsabb, mint a Claude 3.5 Haiku (61 token/másodperc).


Új határok a nagy nyelvi modellek világában

A diffúziós modellek azonban néhányújabb kompromisszumra kényszerülnek . Általában több előremeneteli áthaladást (feldolgozási ciklust) igényelnek a hálózaton keresztül egy teljes válasz generálásához, szemben a hagyományos modellekkel, amelyeknek csak egy menet szükséges tokenenként. Mivel azonban a diffúziós modellek párhuzamosan dolgozzák fel az összes tokent, ezen többletmunka ellenére is nagyobb áteresztőképességet érnek el.

Az Inception szerint a sebességelőny hatással lehet a kódkiegészítő eszközökre, ahol az azonnali válasz befolyásolhatja a fejlesztői termelékenységet, a társalgási AI alkalmazásokra, az erőforrás-korlátozott környezetekre, például a mobilalkalmazásokra, és az AI-ügynökökre, amelyeknek gyorsan kell reagálniuk.

Ha a diffúzió-alapú nyelvi modellek megőrzik a minőséget a sebesség javítása mellett, megváltoztathatják az AI szöveggenerálás fejlődését. Eddig az AI-kutatók nyitottak voltak az új megközelítésekre.

Néhány kérdés fennmarad

Továbbra is kérdéses, hogy a nagyobb diffúziós modellek képesek-e felvenni a versenyt olyan modellekkel, mint a GPT-4o és a Claude 3.7 Sonnet, megbízható eredményeket tudnak-e produkálni sok konfabuláció nélkül, és hogy a megközelítés képes-e kezelni az egyre összetettebb szimulált gondolkodási feladatokat. Egyelőre ezek a modellek alternatívát kínálhatnak a kisebb AI nyelvi modellek számára, amelyek nem áldozzák fel a képességet a sebesség érdekében.

  • Te hogyan értékeled az alternatív architektúrák kísérletezését a transzformereken túl?
  • Mit gondolsz, a diffúziós modellek milyen hatással lehetnek a jövőbeli AI fejlesztésekre?
  • Te hogy érzel az AI szöveggenerálás fejlődésével kapcsolatos gyors technológiai változásokról?


Legfrissebb posztok

MA 11:02

A Garmin Approach S50 visszavág a túlárazott golfóráknak?

A Garmin Approach S50 a márka középkategóriás golfórájaként mindent hoz, amit a hobbigolfos vagy a szenvedélyes játékos elvárhat...

MA 10:57

Az Arc blokklánc páncélt kapott a kvantumtámadások ellen

🛡 A feltörekvő Arc blokklánc már induláskor olyan pénztárcákat kínál majd, amelyek ellenállnak a jövő kvantumszámítógépes támadásainak...

MA 10:44

A minósziak rejtélye: hová lett Kréta ősi nagyhatalma?

A Kr. e. 2000 és 1500 közötti évszázadokban a mai Kréta szigetén és a környező kis szigeteken elképesztően fejlett civilizáció virágzott...

MA 10:29

Az elfeledett LG Rollable még 2026-ban is leiskolázza a mobilokat

📱 Egy igazi ritkaság került elő: a JerryRigEverything csatornáról ismert Zack Nelson szétkapta az LG be nem mutatott, feltekerhető kijelzős mobilját, amelyet a nagyközönség sosem láthatott...

MA 10:22

Az Anthropic óriásbakit vétett: kiszivárgott a Claude Code teljes forráskódja

Hohó, ki gondolta volna, hogy 2026 húsvétján ekkora ajándék pottyan az égből?..

MA 10:01

Az Artemis űrhajósai élőben mutatják a Hold eddig rejtett arcát

Érdekes felvetés, hogy az Artemis-misszió asztronautái most először lépnek be a Hold gravitációs terébe, ahol a Hold vonzása erősebb, mint a Földé...

MA 09:43

A Malwarebytes naplózásmentes VPN-je: tényleg véd, vagy átverés?

🔒 A Malwarebytes, a kiberbiztonsági piac egyik legismertebb neve, most igazi áttörést ért el átláthatóság terén: független külső félnek, az elismert X41 D-Sec csapatnak adott teljes hozzáférést VPN-szolgáltatása forráskódjához és infrastruktúrájához egy kemény, két hónapos átfogó vizsgálathoz...

MA 09:36

A nyelv rejtett törvényei: meghökkentő mintázatok a világban

Bár a világ nyelvei első ránézésre óriási különbségeket mutatnak, a legfrissebb kutatások szerint rendkívül következetes, mélyen emberi szabályokat követnek...

MA 09:22

Az emberközpontú MI jövője: szólhat végre rólunk a technológia?

Az utóbbi évek MI-fejlődése alapjaiban forgatta fel az eddigi elképzeléseket arról, mire képesek ezek a rendszerek az életünkben...

MA 09:15

Az emberiség visszatér a Holdhoz: indul az Artemis II

🚀 Évtizedek óta először jár ismét emberes űrhajó a Hold közelében. Az Artemis II négyfős legénysége – Reid Wiseman, Christina Koch, Victor Glover és Jeremy Hansen – mindössze négy nap alatt elérte azt a határt, ahol a Hold gravitációs vonzása már erősebb, mint a Földé...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/6

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Dragon Ruins I (iPhone/iPad)Ebben a retró hangulatú dungeon crawler RPG-ben a játékos Isigwere fővárosában feltárt ősi romok mélyébe ereszkedik alá...

MA 09:08

Az Artemis II áttöri a határt: közelebb a Holdhoz

🚀 Eljött a pillanat, amire több mint ötven éve nem volt példa: az Artemis II legénysége belépett a Hold szférájába, vagyis abba a térségbe, ahol a Hold gravitációja már erősebb, mint a Földé...

MA 09:01

Az MI felforgatja a bíróságot – a büntetés sem tart vissza ügyvédeket

A mesterséges intelligencia egyre jobban beette magát az ügyvédi irodák világába...

MA 08:57

Az angolok Londont ígérnek az Anthropicnak – de ki jár jól?

A brit kormány minden követ megmozgat, hogy a menő San Franciscó-i MI-céget, az Anthropic-ot még inkább Londonba csábítsa...

MA 08:50

Az igazi ok, amiért retteghet a Bitcoin a kvantumszámítógéptől

Ilyen eset például, amikor egy új technológiai áttörés alapjaiban rengeti meg azt, amit eddig biztonságosnak hittünk...

MA 08:43

A legújabb átverés: tarolnak a QR-kódos bírságcsalások

⚠ Az Egyesült Államokban csalók tömegesen küldenek hamis közlekedési bírságokat tartalmazó SMS-eket, amelyekben állami bíróságok nevében szólítják meg a címzetteket...

MA 08:35

Az EU kifosztva: kiberbűnözők felfalták az adatokat

Felsővezetői szivárgás, pikáns európai botrány! Hackerek egy egyszerű, nyílt forráskódú biztonsági eszköz elleni ellátási lánc elleni támadást használtak ki, hogy bejussanak az Európai Bizottság szervereire...

MA 08:29

A Bitcoin újra 69 ezer dollárnál: itt az új kriptodráma

💰 A húsvéti hosszú hétvége után visszatérő befektetők lendülete nagyot dobott a Bitcoin árfolyamán, amely több mint egy hét után ismét elérte a 69 000 dollárt (kb...

MA 08:21

Az Internet Bug Bounty kifizetései leállnak: jönnek az MI-mókusok, mindent felforgatnak

Most már hivatalos: leállítják az új hibabejelentések befogadását az Internet Bug Bounty programban...

MA 08:16

Az MI-adatközpontok aranykora: pénzözön és biztosítási csapdák

💵 Fontos kérdés, hogy az MI-forradalommal felértékelődő adatközpontok miként formálják át a biztosítási szektort, miközben soha nem látott mennyiségű magántőke és összetett pénzügyi konstrukciók áramlanak ebbe a szegmensbe...

MA 07:57

Az MI-ügynökök hatalomátvétele: káosz vagy technológiai forradalom?

⚡ Fontos kérdés, mennyire vagyunk felkészülve az önállóan működő MI-ügynökök megjelenésére. Míg néhány éve még csak csevegőrobotokkal szórakoztunk, ma már valós aggodalmakat vet fel az, hogy ezek a rendszerek egészen új szintre léptek...

MA 07:43

Az agydaganat Achilles-sarka: rejtőző sejtek hajtják a terjedést

Kanadai kutatók egészen új gyenge pontot találtak a glioblasztómában, amely az egyik legagresszívebb, jelenleg gyógyíthatatlan agydaganat...

MA 07:36

Az Artemis II visszaviszi az emberiséget a Holdra

🚀 Négy űrhajós, több mint 340 000 kilométerre a Földtől, úton a Hold körül – ismét elindult az emberiség a világűr egyik leghíresebb célpontja felé...

MA 07:29

Az Arctic Freezer 4U-SP5 berobban: megfizethető csúcshűtés AMD szerverekhez

⚡ Érdemes megnézni, milyen újdonságokat hoz az Arctic Freezer 4U-SP5 a szerverek világába...

MA 07:22

Az új Hold-korszak: Mit üzen nekünk az Artemis?

🌕 Az emberiség kapcsolata a Holddal mindig is rendkívüli jelentőséggel bírt. A Hold nem csupán egy fényes égitest az éjszakai égbolton: évszázadokon át szolgált óraként, irányadóként, istenként és a tudományos felfedezések mozgatórugójaként...

MA 07:15

Az üzenetküldés új királya jön: a Samsung búcsút int saját appjának

Lassan ideje elengedni a Samsung Messages alkalmazást, hiszen júliusban végleg befejezi szolgálatát...

MA 07:08

Az Orion ablakából: az űrutazás, amelytől eláll a lélegzeted

🚀 Az Artemis II küldetés űrhajósai most tényleg mindent visznek: épp a Hold közelében járnak az Orion fedélzetén, készülődnek a hétfői holdközelítésre, és közben elképesztő panorámában gyönyörködnek...

MA 07:01

Az árak elszabadultak: Miért kerül ma minden ilyen sokba?

Gyerekkoromban apámmal mindig azt játszottuk a boltban, ki találja el jobban, mennyi lesz a végösszeg...

MA 06:57

Az afrikai drónforradalmat a Terra robbantja be

🚀 Egy nigériai start-up, a Terra Industries páratlanul nagy léptékben gyárt drónokat, hogy megvédje Afrika fontos létesítményeit...