Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
Az amerikai LexisNexis, a világ egyik legnagyobb elemzőcége, nemrég elismerte, hogy adatlopás áldozatává vált, ugyanakkor azt hangsúlyozza, hogy a hackerek csak elavult, lényegtelen adatokat szereztek meg...
📞 Érdemes megvizsgálni, hogy a hazai AT&T-felhasználók számára ténylegesen előrelépés-e a szolgáltató most bejelentett új mobilcsomag-választéka, vagy csak újracsomagolt, jól ismert konstrukciókról van szó...
🤓 A kiberbiztonság új korszaka bontakozik ki, ahol az önállóan cselekvő mesterséges intelligencia (MI) ügynökök alapjaiban változtatják meg az erőviszonyokat...
A Google közelgő laptopplatformja, az Aluminium OS, 2026-ban debütálhat, és komoly hangsúlyt helyez a modern munkafolyamatokra és a termelékenységre...
Egy francia egészségügyi szoftvercég, a Cegedim Santé rendszerét súlyos, célzott kibertámadás érte, amely során érzékeny betegadatok milliói kerültek veszélybe...
Továbbá a téli reggelek egyik legnagyobb bosszúsága az elektromos autók tulajdonosai számára, amikor hirtelen, drasztikusan lecsökken járművük hatótávolsága...
Az Apple legújabb fejlesztése, az M5 Pro és M5 Max, új szintre emeli a MacBook Pro teljesítményét: a világ jelenlegi legfejlettebb professzionális laptopprocesszorai mutatkoznak be...
🔏 Érdekes felvetés, hogy a legújabb kibertámadások éppen egy régóta elfogadott, megbízhatónak vélt technológiai szabvány, az OAuth hibakezelésében rejlő hiányosságokat használják ki...
Annak vizsgálatára, hogy az érzelmi kötődés mennyire alapvető szükséglet: egy Japánban élő, Punch nevű hím makákó története bejárta a világot, miután anyja elhagyta őt, később pedig társai is kirekesztették az Ichikawa City Állatkertben...
A mai Magyarország területén, az újkőkorszakban élt emberek temetkezési szokásai és munkaelosztása jóval árnyaltabb képet mutatnak, mint azt sokáig gondoltuk...
Felmerül a kérdés, hogy a James Webb űrteleszkóp új felfedezései vajon választ adnak-e arra, hogyan születtek az univerzum első óriáscsillagai, és miként jöttek létre a legelső szupermasszív fekete lyukak...
Egy lényeges szempont, hogy a Yellowstone Nemzeti Parkban a farkasok és a pumák között állandó a feszültség, de ennek oka nem feltétlenül az, amire elsőre gondolnánk...
A kutatóknak sikerült feltárniuk, miért képesek bizonyos agysejtek sokkal jobban ellenállni az Alzheimer-kór egyik fő károsító tényezőjének, a toxikus tau fehérjének, mint mások...