Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
Áprilisban igazán izgalmas időszak vár az Xbox Game Pass előfizetőire: díjnyertes folytatások, zseniális új független címek, klasszikusok ráncfelvarrott kiadásai és persze jó néhány addiktív gyöngyszem kerül fel a platformra...
A mesterséges intelligencia fejlesztésének egyik legfőbb kihívása, hogy olyan autonóm ügynökök épüljenek, amelyek képesek alkalmazkodni a környezet változásaihoz anélkül, hogy az alapul szolgáló nagy nyelvi modellt újra kellene tanítani...
💉 Míg az elmúlt években a Lyme-kór egyre komolyabb egészségügyi problémává nőtte ki magát, most új remény villant fel: a Pfizer és a Valneva közös fejlesztése révén egy hatékony vakcina kerülhet a piacra, amely segíthet megfékezni ezt a kullancsok által terjesztett betegséget...
☀️ Úgy tűnik, a Samsung most komolyan fejleszti a Now Brief funkcióját: a kiszivárgott képernyőfotók alapján már nemcsak az aktuális nap időjárását mutatja majd, hanem egy teljes, hétnapos előrejelzést is, részletesen megadva a napi maximumokat és minimumokat, valamint ikonokkal illusztrálva a várható időjárást...
🔒 A kontinens legnagyobb vasúti utazásait szervező Eurail kénytelen volt elismerni, hogy tavaly december végén hackerek több mint 300 ezer ügyfél személyes adataihoz jutottak hozzá...
Pár hónap múlva már a Pixel 11 szériát foghatjuk kézbe – és bármilyen hihetetlen, de ezek a telefonok lehetnek az elsők, amelyek megkapják a Samsung vadonatúj M16 OLED paneljét...
🤯 Emellett a Google Home felhasználói egyre nagyobb számban tapasztalnak komoly problémákat a Gemini nevű, frissített hangalapú asszisztenssel, amelyet már 16 új országban vezetik be...
⚠ Az OpenAI felfüggesztette az Egyesült Királyságba tervezett Stargate nagyléptékű MI-infrastruktúra kiépítését, miután makacs energiaár-emelkedés és bizonytalan szabályozási környezet húzta keresztbe a számításaikat...
Jól mutatja, hogy egyetlen elütés is okozhat milliárdos kárt: a második legnagyobb dél-koreai kriptotőzsde, a Bithumb munkatársai februárban tévedésből egy promóció során „BTC”-t írtak „KRW” helyett, így 249 nyertesnek nem 620 000 forintnyi összeget, hanem fejenként 620 000 bitcoint, összesen több mint 40 milliárd dollárt (14 320 milliárd forintot) írtak jóvá belső rendszerükben...
🥗 Ez a jelenség jól illusztrálható azzal, hogy a látszólag hétköznapi fűszernövények – mint a menta, az eukaliptusz és a csilipaprika – természetes vegyületei elképesztő erővel léphetnek fel a szervezet gyulladásos folyamatai ellen, főleg, ha bizonyos kombinációkban találkoznak az immunrendszer sejtjeiben...
Érdekes felvetés, hogy néhány kulcsfontosságú, nyílt forráskódú program fejlesztői napok óta nem tudják frissíteni alkalmazásaikat Windowsra, mert a Microsoft egyik pillanatról a másikra, érdemi figyelmeztetés nélkül felfüggesztette a fejlesztői fiókjaikat...
A Case Western Reserve Egyetem kutatói egy meglepő összefüggésre derítettek fényt: a bélben élő baktériumok által termelt káros cukrok jelentős szerepet játszhatnak a rendkívül pusztító agyi betegségek, például az ALS (amiotrófiás laterálszklerózis) és a frontotemporális demencia kialakulásában...
A Galaxy S22 Ultra-tulajdonosok egy része teljesen váratlan akadályba ütközik, amikor a gyári beállítások visszaállítása után az általuk legálisan vásárolt telefont egyszer csak zárolják — ráadásul nem is ők, hanem egy ismeretlen, gyanús szervezet, a Numero LLC neve jelenik meg a készüléken...
A JBL két új modellje, a Live 780NC és a Live 680NC csábító ígérettel érkezett, hogy a középkategóriás vezeték nélküli, zajszűrős fejhallgatók élmezőnyébe törjön...
🚲 Egy újabb történelmi kört zárt a NASA, amikor az Orion űrhajó tizenhárom évnyi előkészület után négyfős személyzettel kerülte meg a Holdat és indult vissza a Föld felé...
📝 Komolyan mondom, végre egy kis ész a digitális káoszban! A Google beolvasztotta a NotebookLM nevű mesterségesintelligencia-alapú kutatósegédjét a Gemini csevegőjébe, így mostantól már nem kell ezer ablak között vergődve kezelni a jegyzeteidet...
Érdemes megvizsgálni, hogy a Meta legutóbbi MI-modellje, a Muse Spark képes-e új alapokra helyezni a cég mesterségesintelligencia-stratégiáját, miután a Llama 4 csalódást keltő fogadtatásban részesült...