
Alibaba: RynnBrain, a robotok új agya
Az Alibaba DAMO Akadémiája bemutatta a RynnBrain nevű MI-modellt, amelyet kifejezetten fizikai MI-alkalmazásokhoz, például a robotikában fejlesztettek. Vagyis a modell segíti a robotokat a környezetük megértésében és a tárgyak azonosításában. A bemutatón egy robotkart mutattak be, amely megszámolta a narancsokat, a hűtőből kivette a tejet, majd a helyére tette. A fejlesztők szerint a RynnBrain egyik kulcsa az idő- és térbeli tudatosság: a robot képes emlékezni rá, mi mikor és hol történt, követi a feladat menetét, és többlépéses feladatokat is végigvisz megszakítás nélkül. Ennek köszönhetően ezek a robotok sokkal megbízhatóbbak a bonyolult valós környezetekben. Továbbá az Alibaba tágabb ambíciói között szerepel, hogy általános MI-alapot nyújtson a fizikai rendszerek számára.
ByteDance: Seedance 2.0, a szövegből videó készítés mestere
A TikTok fejlesztője, a ByteDance bejelentette a Seedance 2.0-t: egy olyan videókészítő MI-t, amely egyszerű szöveges utasításból képes valósághű videót létrehozni. Képet vagy másik videót is meg lehet adni bemenetként. A Seedance 2.0 technológiai áttörést jelent: már akár 15 másodperces, részletes, élethű klipeket hoz létre, minden apró részletét MI generálja, a vizuális effektektől a zenéig. Egy stockholmi MI-szakember kiemelte, hogy a fejlődés óriási: egy évvel korábban még csak rövid, kevéssé részletes, elmosódott klipeket lehetett előállítani, most viszont már bármilyen jelenetet képesek valósághűen szimulálni.
Vagyis a korábbi generációkhoz képest jelentős a fejlődés a vezérelhetőségben, sebességben és hatékonyságban. A felhasználói visszajelzések pozitívak, ugyanakkor helyi kínai médiajelentések szerint a Seedance feltöltött fotókból automatikusan hangot generáló egyik funkcióját egyelőre felfüggesztették, miután aggályok merültek fel a felhasználói hozzájárulás nélküli hangképzés miatt.
Kuaishou: Kling 3.0, a profi videók új hulláma
A Kuaishou múlt héten jelentette be a Kling 3.0-t, ami szintén szövegből képes videót generálni, részletgazdag képi világgal és immár akár 15 másodpercben. Továbbá egyidejűleg képes natív hangot is előállítani több nyelven és dialektusokban. Vagyis egyre élethűbb videók születnek, amelyek bármilyen hangulatot, stílust és témát visszaadnak. A Kling 3.0 egyelőre csak fizetős előfizetők számára érhető el, de hamarosan mindenki számára elérhető lesz. Ennek köszönhetően a Kuaishou részvényei több mint 50%-kal emelkedtek az elmúlt évben.
Új szereplők a kínai MI-piacon
A feltörekvő kínai cégek közül a Zhipu AI most mutatta be az új GLM-5 öntanuló nyelvi modellt, amely kiemelkedő programozási képességekkel és tartósan futó ügynökök támogatásával tűnik ki. A vállalat állítása szerint ez a modell számos mérőszámban lepipálta a Google Gemini 3 Pro-t, bár ezt független források hivatalosan nem erősítették meg.
Összességében a kínai MI-fejlesztések látványos tempóban közelítenek az amerikai riválisokhoz, sőt bizonyos területeken meg is előzhetik őket.
