
MI hanggenerálás elképesztő sebességgel
A MAI-Voice-1 modell egyetlen GPU-n mindössze egy másodperc alatt képes egy percnyi hanganyagot előállítani. Ezt már több Microsoft-funkcióban is használják: például a hírek napi összefoglalóját MI-hang bemondóval teszik közzé, de magyarázatokat is készít különböző témákról. Bárki kipróbálhatja ezt a fejlesztést, ahol nemcsak a mondandót, hanem a hang és a stílus karakterét is meg lehet választani.
15 ezer GPU, fogyasztói fókusz
A MAI-1-preview modellt közel 15 000 Nvidia H100 GPU-n tanították, hogy gördülékenyen oldjon meg hétköznapi felhasználói kéréseket. Mustafa Suleyman, az MI-vezető szerint a fókusz egyértelműen a lakossági felhasználókon van: a Microsoft rengeteg adaton tudja finomhangolni a mindennapi használatra optimalizált MI-t, különösen a reklámok és a felhasználói aktivitás elemzésével.
Harc a Copilotban és az MI-piacon
A Microsoft az MAI-1-preview modellt fokozatosan fogja bevezetni a Copilot MI-asszisztens írásos funkcióiban, ahol eddig kizárólag az OpenAI nagy nyelvi modelljeire támaszkodtak. A nyilvános tesztelés már elkezdődött az LMArena nevű benchmarking platformon, a cég pedig a jövőben még több, célzott felhasználási területre szánt, specializált MI-modell kidolgozását tervezi.