Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
Az Anthropic vezérigazgatója, Dario Amodei bíróságon támadja meg a Védelmi Minisztérium döntését, miután hivatalosan is értesítették a céget az ellátásilánc‑kockázati besorolásról...
Háromezer évvel ezelőtt Kína belső területein radikális társadalmi változások és drámai népességcsökkenés következett be, amelyet hosszú ideig talány övezett...
Az okostelefonokkal és mindenféle beépített mikrofonnal telített világban egy őszinte beszélgetés szinte lehetetlenné vált – mindenhol ott leselkednek a folyamatosan figyelő eszközök...
😎 Komolyan mondom, hogy ma már a tini fiúk nem egymásnak súgják, mit írjanak a csajoknak, hanem inkább a ChatGPT-hez rohannak, ha üzenetről vagy az első lépésről van szó...
A nagy MI-pánik újra dübörög, de az igazság az, hogy hiába tanulnak a szoftverek kódolni, mémeket gyártani, csetelni, vagy akár jogi esettanulmányok villámgyors összefoglalására, nem hiszem el, de a laptopos melósok többsége most sem lett munkanélküli...
Az ausztrál koalák példája új reményt ad a veszélyeztetett fajoknak. A tudósok genomikai vizsgálatai szerint még a jelentős genetikai szűkületek sem szükségszerűen okoznak végzetes beltenyésztési depressziót, vagyis egy állatfaj nem feltétlenül hal ki a genetikai változatosság csökkenése miatt...
⚡ Fontos kérdés, hogyan lehetne a napenergiát hatékonyabban átalakítani villamos energiává. Nemrégiben a Cambridge-i Egyetem tudósai olyan elképesztően gyors elektronmozgást figyeltek meg, amely teljesen átírhatja a napenergiával kapcsolatos elgondolásokat: az elektronok mindössze 18 femtoszekundum – vagyis kevesebb mint 20 billiárdod másodperc – alatt száguldottak át a napelemekben használt anyagon, egyetlen molekularezgés alatt...
A SeeStar S50 forradalmasítja az asztrofotózást azzal, hogy kompakt méretével és elérhető árával bárki számára lehetővé teszi az univerzum csodáinak megörökítését...
Vadiúj frissítéssel rukkolt elő az X (a régi Twitter, amely már nem akar ránk hallgatni), és mostantól nemcsak az influenszered bugyijába, hanem a tweetjeibe is pénzt kell dobni, hogy lásd, mi a vége!..
👽 A lassított felvételen két acéllemez ütközését láthatjuk, amelyek közé mikrobákat szorítottak – a pusztító ütközést követően ezeknek a parányi élőlényeknek mégis sikerült túlélniük azt, amit a kísérleti berendezés már nem bírt ki...
⚡ Többek között Bill Gates támogatásával a TerraPower évek óta azon dolgozik, hogy megépítse saját Natrium típusú, nátriummal hűtött nukleáris reaktorát az amerikai Wyoming államban, Kemmerer városában...
📸 A Vivo X300 Ultra hamarosan új korszakot nyithat a mobilfotózásban, ugyanis ebbe a telefonba építik be először a Sony vadonatúj, 200 megapixeles LYTIA 901 szenzorát...
🛰 Érdemes megvizsgálni, miért távolodik a legtöbb közeli galaxis a Tejútrendszertől, amikor annak gravitációjának elvileg magához kellene vonzania őket...
🩺 Az Amazon Web Services bejelentette az Amazon Connect Health nevű új platformot, amely mesterséges intelligenciával segíti az egészségügyi szervezeteket a mindennapi adminisztrációs terhek csökkentésében...
A Wikimédia Alapítvány a napokban egy gyorsan terjedő JavaScript-féreggel nézett szembe, amely felhasználói szkripteket módosított és vandalizmust okozott a Meta-Wiki oldalain...
💡 A Google új parancssori eszközt (CLI) tett közzé, amellyel sokkal egyszerűbben lehet automatizálni és integrálni MI‑alapú segédeket, valamint a Gmail, a Docs és más Workspace‑alkalmazások kezelését...
Az utóbbi időben az OpenClaw nevű, nyílt forráskódú személyi asszisztensként népszerűvé vált MI-ügynök telepítőit meghamisították, és veszélyes verzióikat terjesztették a GitHubon keresztül...
Az Xbox-univerzum most izgatottabban zsong, mint egy tini TikTok-sztár, ugyanis Asha Sharma, az Xbox új vezérigazgatója végre bejelentette, hogy jön a következő generációs konzol, amelynek titkos kódneve Project Helix...