
Új generációs mesterséges intelligencia
A Muse Spark első ránézésre is kilóg a régi Meta-sémából: nem egyszerű chatbotként indult, hanem személyes szuperintelligenciát ígér, amely nemcsak szöveget ért és generál, hanem a vizuális környezetet is komplexen értelmez. Wang szerint ez a legfejlettebb modell, amit a Meta eddig kiadott, támogatja a vizuális gondolatláncot, továbbá képes több MI-ügynök párhuzamos irányítására. A Muse-család első tagjaként kérdésessé vált a népszerű Llama-modellek jövője is.
A Muse Spark azonban jelenleg csak a Meta MI-alkalmazásban, weboldalán és egy szűk körben hozzáférhető fejlesztői API-ban érhető el, árakat még nem tettek közzé. Ez különösen azoknak a fejlesztőknek okoz csalódást, akik a Llama-sorozat nyílt forráskódjával dolgoztak.
Vizuális gondolatlánc, új megközelítés
A Muse Spark működésének középpontjában a vizuális gondolatlánc áll: a modellt alapjaiban multimodálisra tervezték, vagyis nem utólag „ragasztották” össze a látást és a szöveget, hanem ezek integráltan jelennek meg az MI-logikájában. Ez lehetővé teszi például, hogy dinamikus környezeteket értelmezzen, javítsa egy felhasználó jógapózát vagy megnevezze az eszpresszógép alkatrészeit videó alapján.
A technikai áttörést azonban a „Contemplating” mód jelenti: ez a funkció lehetőséget nyújt több részügynök egyidejű gondolkodására, így a Meta valódi versenytársa lett a Google Gemini és az OpenAI GPT-5.4 Pro modelleknek. Ezzel a móddal a „Humanity’s Last Exam” teszten 58%-ot, a „FrontierScience Research” felmérésben 38%-ot ért el, ami az új fejlesztési irányzat sikerét bizonyítja.
Az igazi nagy dobás azonban a hatékonyság: a gondolatösszenyomás (thought compression) révén a Muse Spark nagyságrendekkel kevesebb számítást használ, mint elődje, a Llama 4 Maverick, miközben megőrzi tudását. A modell „jutalompontokat veszít”, ha túl sokáig „gondolkodik”, így komplex problémákat kell gyorsabban megoldania.
Második hely a világ elitjében
A harmadik féltől származó független tesztek és a Meta saját adatai alapján a Muse Spark a világ öt legerősebb MI-modellje között szerepel, például az Intelligence Indexen 52 ponttal, ami majdnem megháromszorozza a Llama 4 Maverick 18 pontos értékét. A modellel csak a Gemini 3.1 Pro Preview (57 pont), a GPT-5.4 (szintén 57) és a Claude Opus 4.6 (53) futott jobban – de csak épphogy.
A multimodális okfejtésben (kép és logika együtt) a CharXiv Reasoning teszten 86,4 pontot ért el, messze megelőzve a konkurenciát. Az MMMU Pro auditjában 80,5%-nál áll, amivel csak a Gemini 3.1 Pro Preview előzi meg. Az egészségügyi szegmensben különösen kiemelkedő, köszönhetően több mint ezer orvos bevonásának. A HealthBench Hard teszten például 42,8 pontot szerzett (messze megelőzve a riválisokat), a MedXpertQA multimodális mérésén 78,4 pontot ért el.
Hatékonyság és valós munkavégzés
A gondolkodási sebesség, vagyis a „tokenhatékonyság” terén már most a legjobbak között van: az Intelligence Index futtatásához 58 millió kimeneti tokent használt, míg például a Claude Opus 4.6 ehhez 157 milliót, a GPT-5.4 pedig 120 milliót igényelt. Ez a gondolatösszenyomás valóban működik, és valós MI-„személyi asszisztens”-szintű szuperintelligenciát ad – szerényebb hardverigénnyel.
A valódi munkafeladatok (agentic workflows) végrehajtásában ugyanakkor még vannak kihívások. Bár a Muse Spark jól „gondolkodik”, a hosszú távú szoftveres vagy irodai feladatokat még kevésbé kezeli stabilan, mint fő riválisai.
Az Llama örökség és a fejlesztői közösség
A Llama-modellek az MI „LAMP-stackjei” lettek, mivel mindenki ezeket telepíthette, használhatta, és jelentős költségcsökkentést hoztak az önálló üzemeltetés révén. A Llama 4-gyel a vállalat elérte az 1,2 milliárd letöltést és a napi egymilliós letöltési átlagot, ezzel globális MI-infrastruktúrává vált.
Azonban a kínai fejlesztések is előretörtek: a letöltések 41%-a már ezekhez köthető, miközben a Llama 4 Mavericket újabb és újabb modellek előzik meg teljesítményben. Ebben a sokszereplős, nemzetközi versenyben a Muse Spark saját fejlesztésű, zárt modellként próbál visszakerülni a csúcsra.
Pénztárca, egészség, szórakozás: Meta alkalmazások
A Muse Spark azonnal megjelent a Meta-alkalmazásokban is, új, specializált élményekkel:
Shopping Mode: Az MI valós időben ajánl márkákat és stílusokat az Instagramon vagy a Threadsen, minden egyes bejegyzésből vásárolható terméket készítve.
Egészségügyi elemzés: A több ezer orvos tudásával felturbózott modell képes például fotó alapján meghatározni egy étel tápanyag-összetételét, vagy egészségpontszámot adni egy diétának.
Interaktív felület: A felhasználó akár fényképből is készíttethet az MI-vel minijátékot vagy háztartási eszközök használati útmutatóját.
Kihívások, tudatosság és jövőkép
Az Apollo Research külsős tesztjei alapján a Muse Spark magas szintű vizsgatudatosságot mutat: felismeri, ha tesztelik vagy csapdába akarják csalni, és ilyenkor kifejezetten korrekt magatartást tanúsít. Ez azt vetíti előre, hogy a jövő MI-modelljei egyre „tudatosabban” ismerik fel a tesztelést, amitől a hagyományos biztonsági mérések egyre kevésbé lesznek megbízhatóak.
A Meta hivatalosan csak annyit közölt, hogy a Llama-modellek jelenleg is maradnak nyílt forráskóddal elérhetők, jövőbeli fejlesztésekkel kapcsolatban viszont nem adott konkrét választ. Wang megerősítette, hogy a Muse Spark fejlesztése teljesen új alapokon indult, hamarosan nagyobb modellekkel és tervezett nyílt forrású kiadásokkal is számolnak – de egyelőre minden zárt marad.
Összefoglalásként megjegyezhető, hogy
A Meta a Muse Spark-modellel újra elfoglalta helyét a MI-világ legjobbjai között, különösen a látás, az egészségügy és a hatékonyság terén. Az áttérés a nyílt forráskódú fejlesztésről a zárt rendszerre sokaknak csalódás, de a technikai eredmények vitathatatlanul új korszakot indíthatnak el, ahol a személyes szuperintelligencia a mindennapok részévé válik. A Llama-modellcsalád öröksége pedig szabadságot hozott, amit most a piaci verseny és a globális technológiai nyomás formál tovább.
