Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
💻 Amit látunk, az túlmutat a megszokotton: a nagyméretű nyelvi modellek (LLM-ek) üzemeltetése ma már nem csupán jó algoritmusokról szól, hanem komoly hardvertervezési és optimalizálási kérdés is lett...
Erre utal többek között az, hogy a fekete lyukak soha nem tűnnek el teljesen, még akkor sem, ha Hawking sugárzása révén látszólag folyamatosan veszítik tömegüket...
A mesterséges intelligencia fejlesztésének újabb mérföldkövéhez érkeztünk: az Anthropic piacra dobta legújabb, mindenki számára elérhető nagy nyelvi modelljét, a Claude Opus 4...
Észak-Amerika egyes részein különleges látványosság várható ezen a hétvégén: ritkán látható északi fények festik az eget, mindezt egy jelentős, a Nap légkörében, a koronában keletkezett koronalyuknak köszönhetően...
A Bitcoin árfolyama csütörtök délelőtt hirtelen esett vissza, miután sorozatosan kudarcot vallott a 27,5–28 millió forintos (75 000–76 000 USD) árfolyamszint áttörésében...
Erre utal többek között az, hogy az IBM 6 milliárd forint (17 millió dollár) összegben kötött megállapodást egy, a sokszínűség, esélyegyenlőség és befogadás (DEI) programjai miatt indult vizsgálat ügyében...
🥗 Ami először apróságnak tűnt, most áttörésnek számít a tudósok szerint: egy természetes hormon, az FGF21 képes visszafordítani az elhízást egerekben...
Az egyik legnépszerűbb online játékplatform, a Roblox összesen több mint 4,4 milliárd forintot (12 millió USD) fizet, és új biztonsági intézkedéseket vezet be, miután Nevadában per elé került a gyermekvédelem hiányosságai miatt...
Felmerül a kérdés, meddig vagyunk biztonságban a digitális világban: Mexikó történetének egyik legsúlyosabb kiberbiztonsági támadását egy maroknyi hacker hajtotta végre mesterséges intelligencia segítségével...
Élvezetes újítás érkezett az Opera böngészőhöz, aminek garantáltan örülni fognak azok, akik imádják a mesterséges intelligenciával felturbózott netezést...
💸 Egy trükkös módszerrel teljesen zárolt iPhone-ról sikerült 4 millió forintot ellopni, ráadásul anélkül, hogy a tulajdonos bármi gyanúsat észrevett volna...
Egy most felfedezett kártevő, a ZionSiphon kifejezetten az ipari vezérlőrendszerek ellen készült, és víztisztító- és sótalanító üzemek működését fenyegeti...
⚡ A Mozilla legújabb fejlesztéseként bemutatta a Thunderbolt MI-klienst, amely lehetővé teszi, hogy magánszemélyek és vállalkozások saját, helyben futó MI-infrastruktúrát építsenek ki, teljesen függetlenül felhőalapú külső szolgáltatóktól...
💻 Az Intel hosszú idő után frissíti a nem-Ultra Core processzorokat, amelyekre eddig a korosodó Raptor Lake architektúrára épülő meglévő Core-szériák voltak jellemzők...
Az amerikai Commodity Futures Trading Commission (CFTC) élén Mike Selig egyre növekvő felügyeleti feladatokkal néz szembe, miközben az ügynökség létszáma az utóbbi években jelentősen csökkent...
💰 Az elmúlt másfél évben a tokenizáció robbanásszerű fejlődésen ment keresztül: eddig csak koncepció volt, de ma már a portfólióépítés legitim eleme lett...
Kiemelkedő nap a történelemben: szerződés, lázadás, köztársaság és űrdrámából csoda. A legemlékezetesebb pillanatok között ott van a Republic of Ireland kikiáltása, a The Canterbury Tales (Canterbury mesék) első udvari előadása és az Apollo 13 biztonságos hazatérése...
A Grand Teton Nemzeti Parkban elképesztő módon léptek fel a fogyatkozó fürjtyúk-populáció megmentéséért: nemcsak hagyományos madárcsali figurákat használnak, hanem rendkívül ötletes, robotizált példányokat is...
Érdekes, hogy a kilencéves Kai Moskvitch hobbiból podcastet indított, amelyben azt kutatja, miként változtatja meg a mindennapjainkat a kvantumtechnológia...
💸 Az Anna’s Archive nevű nyílt könyvtárat és keresőmotort 115 milliárd forint (322 millió dollár) kártérítés megfizetésére kötelezték, miután állítólag letöltötte és elmentette a Spotify teljes zenegyűjteményét...
Közeleg az az idő, amikor az uniós tinik nemcsak szívüket, hanem életkorukat is egy appban hordozzák: az új digitális igazolványalkalmazás lehetővé teszi, hogy bárki igazolja a korhatáros tartalmakhoz való hozzáférési jogosultságát, miközben személyes adatai titokban maradnak...