2025. 03. 18., 20:29

Az új Stability AI modell térhatású videóvá alakítja a 2D képeket

Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva. A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.

Korlátok és elérhetőség

A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.

 

A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.

2025, adrienne, techcrunch.com alapján

Legfrissebb posztok

MA 07:03

A mesterséges intelligencia miatti szorongásról így beszélj őszintén a csapatoddal

Ilyen volt például, amikor a járvány alatt a vezetők rájöttek, hogy a csapat egységét akkor is fenn kell tartani, amikor teljes a bizonytalanság...

MA 06:51

Az X új MI‑algoritmusa felforgatja az üzleti világot

🚀 Az X, korábbi nevén Twitter, megnyitotta új, MI-alapú ajánlórendszerének forráskódját, amit mostantól az Apache 2...

MA 06:43

Miért nem bírja a tempót Európa a startupversenyben?

Európa gazdasága az elmúlt évtizedekben rengeteget fejlődött, de hiába közelíti meg az Egyesült Államokét méretben, továbbra is alig születnek világszinten meghatározó, piacvezető vállalatok...

MA 06:33

Az OpenAI megmondja, hány éves vagy – de hihetünk neki?

🕵 Az OpenAI egy világszerte elérhető életkorelemző rendszert vezet be a ChatGPT-fiókoknál, hogy kiszűrje a kiskorú felhasználókat...

MA 06:26

Az ősrobbanás hajnala: a Hajnal istennője szupernóva a JWST felvételén

Mindössze egymilliárd évvel az univerzum születése után robbant fel egy ősi csillag...

MA 06:18

A YouTube újabb bakija: eltűntek az extra feliratok

Az elmúlt napokban több YouTube-videós is észrevette, hogy eltűntek a platformról a speciális, extra testreszabható SRV3-feliratok – ráadásul mindenféle előzetes értesítés nélkül...

MA 06:05

Történelmi események a mai napon (Január 21.)

Rendhagyó nap a történelemben: kivégzik XVI. Lajost, összeül az első Dáil Éireann, és vízre kerül az első nukleáris tengeralattjáró...

MA 06:02

Az MI-válaszok újabb álhíráradatot zúdítanak ránk

A technológiai világ szinte vakon követi a mesterséges intelligencia ígéreteit: a Google beépíti az MI-t a Chrome-ba, vezető techcégek már a weboldalak végét jósolják...

kedd 23:09

Az Atlanti-óceán mélye riasztóan öregszik – mi áll mögötte?

A mélytengeri vízkörforgás kulcsszerepet játszik a Föld éghajlatában, de új kutatások szerint az Atlanti-óceán északi régiójában egyértelműen lassul a víz megújulása...

kedd 14:12

Már megint kapott egyet a Meta – vége a VR-álomnak

💸 A Meta négy évvel ezelőtt még nagy reményekkel, sőt, teljes vállalati identitásváltással vágott bele a virtuális valóság meghódításába...

kedd 14:02

Az új kvantumhatár: a spin mérete felforgatja a Kondo-hatást

Külön említést érdemel, hogy a kondenzált anyagok fizikájában a kollektív viselkedés egészen szokatlan jelenségeket eredményez...

kedd 13:55

Mégsem bíznak a GoFundMe-ben – miért adakoznak mégis az amerikaiak?

💰 Az Egyesült Államokban ma már szinte minden tragédia együtt jár a közösségi adománygyűjtéssel...

kedd 13:37

Az EOS C50 továbbra is verhetetlen választás a filmeseknek

🎬 Az új Canon EOS R6 Mark III megjelenésével sokan úgy gondolják, minden korábbi modellt érdemes elfelejteni, pedig a Canon EOS C50 komoly érvekkel száll versenybe a professzionális videókészítők számára...

kedd 13:19

Az összes bolt polcairól eltűnik a listeriás csirkemell

🚨 Majdnem hét tonna, azaz 6 220 kilogramm, készre sütött, grillezett csirkemellfilét kellett visszahívni Listeria-fertőzés gyanúja miatt...

kedd 13:01

Egy apró böngésző rendet vág a Chrome-ban, Edge-ben és Firefoxban

A Just the Browser egy friss fejlesztés, amelyet azért hoztak létre, hogy megszabadítsa a böngészőket a felesleges funkcióktól, anélkül, hogy új böngészőt kellene telepíteni vagy forkot használni...

kedd 12:56

A be nem gyógyuló sebek rejtélye: mi áll a háttérben?

🤒 Érdemes megvizsgálni, miért kínlódik annyi ember azzal, hogy sebei hónapokon át nem hajlandók begyógyulni – még antibiotikumos kezelés mellett sem...

kedd 12:37

A robot MI nélkül is rátalál a fényre

🤖 Egy egyszerű vonalkövető robot elkészítése nem igényel sem processzort, sem bonyolult szoftvereket – ezt Jeremy retró stílusú kis szerkezete is mutatja...

kedd 12:19

Jön az amerikai Gömb: gömbaréna épül Washington mellett

🎖 Las Vegas ikonikus gömbje után most Maryland is megkapja a saját Sphere-élményét: a tervek szerint 6 000 főt befogadó koncertarénát építenek National Harborban, Washington közvetlen közelében...

kedd 12:01

Az OpenAI nagy dobása: MI mindenütt, mindenkinek

Az OpenAI 2026-ra az MI hétköznapi elterjesztésére helyezi a hangsúlyt, miközben rekordösszegű, közel 516 ezer milliárd forintot költ infrastruktúrára...