Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
Az Android eddig is sokkal hatékonyabban kezelte az értesítéseket, mint az iOS, ami nemcsak az alkalmazások újításaiban, hanem a testreszabási lehetőségekben is megmutatkozik...
A globális villamosenergia-rendszer nagy fordulóponthoz érkezett: 2025 végére a megújuló energiaforrások a teljes elektromos kapacitás közel felét adták világszerte, elsősorban a napenergia robbanásszerű növekedésének köszönhetően...
Beszédes asszisztens, gyors rendelés Az új Alexa Plus már képes az Uber Eats és a Grubhub felületein keresztül ételt rendelni, ehhez azonban a megfelelő eszközre lesz szükséged...
A világ egyik legnagyobb orvostechnológiai cége, a Stryker Corporation, három héttel egy jelentős kibertámadás után ismét teljes kapacitással működik...
⚡ Az MI fejlődése elképesztő tempót diktál, de valójában még senki sem tudja pontosan, mikor és hogyan fordítja majd fel a munka világát, a termelékenységet vagy az üzleti versenyt...
Április elseje most tényleg nagy dobás: nemcsak hogy indul a tavasz, meg persze az áprilisi tréfák, de ma este felbukkan a tavasz első, úgynevezett Rózsaszín Holdja (Pink Moon) – mégpedig egészen különleges időpontban...
📺 Végre elköszönhetsz a Samsung-féle okos vargabetűktől! Mostantól a Samsung tévéd önállóan képes együttműködni a Google Casttal, így nem kell többé kerülgetned a Smart View trükközéseit...
🔒 A kriptopénzek világában a legtöbben már hallottak rémtörténeteket elvesztett tokenekről, feltört számlákról vagy egyenesen teljes tőzsdék összeomlásáról...
🤔 Többek között az utóbbi évek mesterséges intelligencia (MI) hullámai mögött álló nagy nyelvi modellek (LLM-ek) néhány ponton messze elmaradnak az emberi logikai gondolkodás szintjétől...
Jellemző példa erre, hogy a Cisco több súlyos és kritikus hibát javított, köztük egy Integrated Management Controller (IMC) hitelesítés-megkerülési hibát, amellyel támadók adminisztrátori jogokat szerezhetnek...
Különösen igaz ez akkor, ha a vállalatok elhanyagolják a rendszeres frissítéseket: jelenleg több mint 14 000 F5 BIG-IP Access Policy Manager példány van közvetlenül kitéve kritikus távoli kódfuttatási (RCE) sebezhetőségnek az interneten...