Az Alibaba nagy dobása: új MI-modell forradalmasíthatja a videózást
A kínai technológiai óriás, az Alibaba Cloud 2 milliárd jüant (kb. 110 milliárd forintot) fektetett a ShengShu nevű startupba, amely a Vidu elnevezésű MI-alapú videógeneráló eszköz fejlesztéséért felelős. Ezzel a befektetéssel az Alibaba olyan területekre lép, ahol a fókusz már nem a szövegalapú MI-modelleken, hanem a való világ minél élethűbb leképezésén van. A ShengShu fejlesztéseihez a Baidu Ventures és a TAL Education is csatlakozott, tovább erősítve az MI-mezőny átalakulását Kínában.
Videóalapú MI: új irányok és alkalmazási területek
A ShengShu célja, hogy olyan átfogó világmodellt építsen, amely többféle adatforrást – például képet, hangot, tapintási információkat – használ fel. Ezáltal az MI a fizikai világot jóval természetesebben tudja modellezni, mint a jelenlegi nagy nyelvi modellek. A fejlesztések olyan szektorokat érintenek, mint például az autonóm járművek vagy a robotika, ahol különösen fontos, hogy az MI érzékelje és megértse a környezetet.
Nem elhanyagolható tényező, hogy a cég legújabb MI-modellje, a Vidu Q3 Pro, már a top 10-ben szerepel a szöveg és képek alapján automatikusan videót generáló rendszerek között. A ShengShu partnerséget épít ki vezető robotikai cégekkel is, így a technológia emberszerű robotok fejlesztésében is alkalmazható lesz, ipari és otthoni környezetben egyaránt.
Verseny az MI-világmodellek piacán
Az Alibaba egyre nagyobb hangsúlyt fektet a világmodelleken alapuló MI-fejlesztésekre, a szöveges modellektől elmozdulva. A cég és a Baidu Ventures nemrég befektetett a Tripo AI-ba is, amely fotókból készít 3D modelleket, és korábban 60 millió dollárt (kb. 21 milliárd forintot) fektetett a PixVerse-be, amely szintén MI-alapú videógenerátorokat fejleszt. Az Alibaba saját, nyílt forráskódú MI-modellekkel és videógenerátorokkal is piacra lépett.
Végső soron az MI-nek a humán intelligencia utánzásához három képességre van szüksége: a következtetésre (reasoning), a fizikai világ megértésére és a folyamatos tanulásra. Míg a tanulási rész még fejlesztés alatt áll, az LLM-alapú chatbotok már létrehozták a tudásalapot. Ezáltal a világmodellek jelenthetik az MI következő nagy előrelépését.
🚀 Az emberiség történetében aligha akad olyan bátor vállalkozás, mint amikor egy nukleáris meghajtású oktokoptert küldenek a Naprendszer legtitokzatosabb holdjára, a Titánra...
A génszerkesztés évtizedek óta nagy reményeket kelt a gyógyászatban, de hosszú utat kellett megtenni, mire eljutottunk oda, hogy embereken is alkalmazni lehessen...
Az elmúlt időszakban egyre többet hallani arról, hogy a kvantumszámítógépek mekkora fenyegetést jelenthetnek a blokklánc-technológiára és a kriptoeszközökre...
Az új Google Gemini alkalmazás végre olyan funkcióval bővült, amire sokan vártak: bevezették a noteszeket, amelyek egyszerre tárolnak beszélgetéseket, fájlokat és hosszabb távú projekteket...
A laboreredmények megérkezése előtti várakozás hetei komoly feszültséget jelentenek sokaknak. És mire végre kézhez kapjuk a labornyelven írt vérvizsgálati leletünket, gyakran nem is értjük, hogy pontosan mi mit jelent benne...
📱 Közeledik az Android egy várva várt újítása: a Tap to Share lehetőséget kínál majd fotók, videók, névjegyek, helyadatok és linkek villámgyors átvitelére két telefon között...
A Firefox böngészőt fejlesztő Mozilla éles kritikával illette a Microsoftot, amiért a Windows operációs rendszer és a Copilot mesterséges intelligencia egyre szorosabb integrációja ellehetetleníti a független böngészők versenyét...
⚠ A népszerű Smart Slider 3 Pro bővítmény frissítőrendszerét sikeresen támadták meg hackerek, majd ártó szándékú frissítést juttattak el a WordPress- és Joomla-rendszerekre...
A második Artemis-küldetés döntő fázisában jár, amelyben a NASA Orion űrhajója tökéletesen teljesít – azonban egy megmakacsolt szelep miatt mégis újratervezés vár a következő holdrepülésre...
🚀 A ChatGPT igazán nagy dobással rukkolt elő: mostantól havonta 36 ezer forintért (100 USD) lehet hozzájutni a Pro-csomaghoz az USA-ban, amellyel ötször gyorsabban haladhatsz a kódolással, mint a Plus változattal...
Felmerül a kérdés, hogy a városok mennyire tudják követni az utak állapotát, hiszen egy váratlan kátyú nemcsak bosszúságot, hanem akár súlyos károkat is okozhat az autóknak...
Többek között a holland egészségügyi informatikai piac egyik legnagyobb szereplője, a ChipSoft is kénytelen volt leállítani weboldalát és digitális szolgáltatásait, miután zsarolóvírus-támadás érte...
🚀 Nyolc mozgalmas űrbeli nap után az Artemis II legénysége és a NASA teljes csapata a küldetés utolsó, legkeményebb próbájára készül: az űrhajósoknak épségben kell hazatérniük...
🐡 Érdekes felvetés, hogy a galaxisok fejlődésének rejtett szakaszait egy különleges, távoli rendszer segítheti megfejteni, amelyet az űrtávcsövek csaknem véletlenül fedeztek fel...
Különösen említést érdemel, hogy az olaj világpiaci ára, a Dated Brent, az utóbbi napokban vad kilengéseket produkált, ami súlyos stresszt jelez az energiaszektor szereplőinél...
😈 Erre példa, amikor egy ismeretlen hackercsoport kifejezetten nagyvállalatok felsővezetőit próbálja átverni, és ellopni Microsoft-fiókjaik hitelesítő adatait...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Greeny Word Journey (iPhone/iPad)A Greeny Word Journey egy lenyűgöző szókirakó játék, mely élvezetesen fejleszti a szókincset és a logikai képességeket...
🛡 Ha valaki kemény terepen dolgozik, nem elég egy hétköznapi tablet – a Dell Pro Rugged 12-t viszont mintha kifejezetten sivatagi viharhoz, extrém hideghez vagy zuhogó esőhöz találták volna ki...
Hiába a menő dizájn, a hűvös tech-hangulat és a fényes Apple-logó, három amerikai bolt örökre lehúzza a rolót: Trumbull (Connecticut), Escondido (Kalifornia) és Towson (Maryland) júniusban végleg bezárnak...