Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
A James Webb Űrteleszkóp segítségével a csillagászok feltérképezték az univerzum sötét anyagának eddigi legnagyobb szakaszát, elmélyítve ezzel a titokzatos anyag kozmikus tájat formáló szerepének megértését...
🎮 Bár gyakran egybemossuk a retro játékkonzolokat, az első 3D-s grafikai rendszerek, mint a Nintendo 64 és a Sony PlayStation, vizuálisan markánsan különböztek egymástól...
Lenyűgöző, több mint 180 millió éves ősi nyomokat fedeztek fel Marokkó Közép-Atlasz-hegységében, amelyek új fejezetet nyithatnak az élet eredetének kutatásában...
Kérdés, mikor és milyen formában lép be az Apple a hajlítható okostelefonok világába – hiszen míg a Samsung és a Google már évekkel ezelőtt piacra dobták saját hajlítható mobiljaikat, az Apple eddig feltűnően kimaradt ebből a kategóriából...
Waymo önvezető taxijai komoly problémákkal küzdenek Austinban, mert rendszeresen nem állnak meg az iskolabuszoknál, amikor éppen gyerekek szállnak le vagy fel...
Fontos kérdés, hogy miként tudja az OpenAI vezetősége kezelni az egyre erősödő kritikákat, amelyek a vállalat növekedésével párhuzamosan szaporodnak...
A legnagyobb technológiai cégek, köztük az Amazon, a Microsoft, a Meta és a Google elképesztő összegeket terveznek költeni MI-fejlesztésekre 2026-ban...
Az üzleti folyamatok nagy része ma már böngészőben zajlik: SaaS-alkalmazások, belépési rendszerek, adminisztrációs felületek és MI-eszközök mind ezt a felületet teszik elsődlegessé az adatkezelésben és a munkavégzésben...
🕵 Egy eddig ismeretlen eszközkészletet, a DKnife-ot már 2019 óta használják hackerek arra, hogy hálózati átjárókon (routereken, edge eszközökön) elcsípjék és módosítsák a forgalmat, kémkedjenek, sőt, kártékony programokat juttassanak el a hálózatra csatlakozó eszközökre...
🧠 Egyre több kutatás utal rá, hogy az ősi, amazóniai pszichedelikus főzet, az ayahuasca segítséget nyújthat a poszttraumás stressz-zavar (PTSD) kezelésében...
🙁 Az Egyesült Államok Kibervédelmi Ügynöksége (CISA) figyelmeztetett, hogy a SmarterMail szoftver súlyos biztonsági hibáját (CVE-2026-24423) már aktívan kihasználják zsarolóvírus-támadásokhoz...
Az elmúlt években forradalmi lehetőség sejlett fel a poszttraumás stressz-zavar (PTSD) gyógyításában: az MDMA és a pszilocibin, ezek a hírhedtnek tartott pszichedelikumok ígéretes hatást mutatnak a súlyos pszichés sérülések leküzdésében...
Újabb izgalmas fejlesztéssel jelentkezik a Spotify: elindult az „About the Song” (A dalról) funkció, amivel végre bepillanthatsz a slágerek születésének kulisszái mögé...
A 2026-os Super Bowl reklámjai idén új szintre emelték az MI-technológiát, nemcsak a hirdetések elkészítésénél, hanem a legújabb MI-termékek népszerűsítésében is...
Az MI-kutatás élvonalába tartozó új modellek már nemcsak abban segítenek a mérnököknek, hogy gyorsabban írjanak kódot vagy automatizáljanak rutinfeladatokat...