Az új Stability AI modell térhatású videóvá alakítja a 2D képeket

Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva. A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.

Korlátok és elérhetőség

A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.

 

A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.

2025, adrienne, techcrunch.com alapján

Legfrissebb posztok

MA 10:22

A Disney+ belép a függőleges videók korszakába

Idén érkezik a Disney+ újítása: a függőleges videófolyam, amely a TikTok sikerét lovagolja meg...

MA 10:08

Az ultragyors UV-fény átírhatja a kommunikáció és a képalkotás szabályait

Továbbá megemlíthető, hogy a fotonikus technológiák, amelyek az ultraibolya (UV-C) tartományban (100–280 nm) működnek, már most kulcsszerepet játszanak számos területen, a szuperfelbontású mikroszkópiától az optikai kommunikációig...

MA 10:02

A Grok-bot botránya: kiskorúakat ábrázoló szexuális képek a sötét weben

Az internet biztonságáért küzdő szervezetek komoly figyelmeztetést adtak ki: az Elon Musk tulajdonában lévő Grok MI-chatbotot bűnözők használták fel gyermekekről készült szexuális képek létrehozásához...

MA 09:43

A Dell 52 colos, 6K-s óriása letarolja a piacot

A Dell bemutatta az UltraSharp 52 Thunderbolt Hub monitort, amely igazi óriás: 132 cm-es (52 hüvelykes) képátlójával és elképesztő 6K felbontásával jelenleg egyedülálló a világon...

MA 09:36

Az MI a Fordokba költözik – és ez már valóság

🚗 A Ford is beszáll az MI-alapú élményversenybe: 2026-tól a gyártó autóiban személyre szabott digitális asszisztens segíti majd a sofőrt és az utasokat...

MA 09:29

A trónról taszítva: zuhan a ChatGPT népszerűsége

ChatGPT piaci részesedése jelentősen visszaesett, miközben a Google Gemini egyre nagyobb teret hódít a weben...

MA 09:22

Az Apple-gépeken leálltak a Logitech appok – kitört a káosz

A Logitech Options+ és G HUB alkalmazások hirtelen működésképtelenné váltak Macen, miután egy lejárt tanúsítvány blokkolta az indításukat...

MA 09:08

A JPMorgan veszi át az Apple Cardot – végre búcsú a Goldmantól

Az Apple hivatalosan bejelentette, hogy az Apple Card új kibocsátója a JPMorgan Chase lesz...

MA 09:01

Az OpenAI nem használja fel egészségügyi adataidat MI-képzéshez

💉 Az OpenAI elindítja a ChatGPT Health nevű új funkciót, amely kizárólag egészségügyi beszélgetésekre készült, és biztonságos, privát teret kínál a felhasználóknak...

MA 08:57

A kínai MI új ragadozója berobban a hongkongi tőzsdére

📈 Kína vezető MI-fejlesztője, a Zhipu részvényei sikeresen debütáltak a hongkongi tőzsdén, miután 558 millió dolláros (207 milliárd forint) IPO-jával elsőként a kínai „MI-tigrisek” közül vált nyilvános részvénytársasággá...

MA 08:43

Az OpenAI már az egészségügyi adataidra is szemet vetett

Az OpenAI új lehetőséget mutatott be: hamarosan feltöltheted egészségügyi adataidat a ChatGPT-be, azaz megoszthatod vele orvosi leleteidet, vizsgálati eredményeidet vagy a fitneszalkalmazásokból származó információkat...

MA 08:29

A jsPDF kritikus hibája miatt érzékeny adatok szivároghatnak ki

A népszerű jsPDF könyvtárban egy kritikus sérülékenységre derült fény, amely lehetővé teszi támadók számára, hogy érzékeny adatokat lopjanak el a helyi fájlrendszerről a generált PDF-fájlokon keresztül...

MA 08:23

A filléres MI, amely lenyomja az óriásokat: itt a MiroThinker 1.5

Külön említést érdemel, hogy a nemzetközi MI-piac új üdvöskéje, a MiroMind MiroThinker 1...

MA 08:16

Az idegsejtek felpörgetése áttörést ígér a krónikus fájdalom ellen

💡 A tudósok új felfedezése szerint a sejtek erőműveiként ismert mitokondriumok időnként egyik sejtből a másikba vándorolva segítik az idegsejtek működését – a folyamat pedig áttörést hozhat a krónikus fájdalom csillapításában...

MA 08:01

A többség ki nem állhatja a Remix gombot a Google Üzenetekben

😡 A Google tavaly év végén vezette be a Remix nevű MI-alapú képszerkesztőt a Messages alkalmazásba, amely lehetővé teszi, hogy képeken, közvetlenül üzenetküldés közben, módosításokat végezz...

MA 07:57

Az MI fűti a hackerek rohamát a kriptós szerverek ellen

🔥 A GoBruteforcer nevű botnet új hulláma a nem megfelelően védett kriptó- és blokklánc-projektek szervereit támadja...

MA 07:51

A színes analóg tévé rejtélyei: mi van a PAL és NTSC mögött?

Érdemes megvizsgálni, hogy mi rejlik a PAL és NTSC mozaikszavak mögött, és mitől lesz a jel valóban színes videójel...

MA 07:44

Az AFEELA 1: a jövő szórakoztató elektromos kapszulája

🚘 Idén ismét reflektorfénybe került a Sony és a Honda közös villanyautója, az AFEELA 1, amely a tavalyi modellhez képest kifinomultabb és gördülékenyebb élményt kínál, miközben továbbra sem akar klasszikus autó lenni...

MA 07:36

A nanocsatornák feltárják az agy emlékezetének titkát

Kínai kutatók új áttörést értek el az idegrendszer titkainak feltárásában: bioinspirált nanocsatornákat fejlesztettek, amelyek képesek élethűen modellezni az agyi memóriát, és ezzel megnyitják az utat a következő generációs MI-alapú számítógépek előtt...