Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
🗺 Felmerül a kérdés, hogy lehetséges-e valóban újat mondani a nagy klasszikusok után, vagy az új versenyzők örökké csak az elődök nyomdokában járnak majd...
🔧 A videokártyák túlmelegedése újabban mindennapos probléma, ami miatt a gyártók nem csatlakozócserével, hanem újfajta kábelekkel és tápegységekkel igyekeznek biztonságot nyújtani...
💸 A Chuwi bemutatta legújabb ultrakönnyű laptopját, a CoreBook Air 226V-t, amely kevesebb mint 1 kg-ot nyom, és mindössze 10,9 mm vastag házba csomagolja a legújabb Intel Core Ultra 5 226V processzort, amely a Lunar Lake architektúrára épül...
🤔 Az utóbbi időben feltűnően magas nyerési arányokat mértek a katonai és védelmi eseményekre kötött fogadásoknál a Polymarket platformján – messze túlszárnyalva a politikai fogadások átlagát...
A hardverpiacra már most komoly hatással van a globális memóriahiány, amely az előrejelzések szerint hamarosan érzékelhető lesz a Microsoft bevételeiben is...
Egy kelet-norvégiai farm földjében csaknem 3 000, különböző országokban – Angliában, Németországban, Dániában és Norvégiában – vert ezüstérmét tártak fel a régészek...
Megvizsgálandó, hogy a mesterséges intelligencia miként alakítja át a nagyvállalatok ügyfélszolgálati működését, és miért döntenek óriáscégek, mint az Accenture vagy az Adobe, úgy, hogy ilyen fejlesztések mögé sorakoznak fel...
🎉 Hadd ordítsam bele a levegőbe, hogy eddig a kép a képben funkció a legtutibb YouTube-extrák közé tartozott, de csak azok élvezhették, akik fizettek érte...
🔬 A ZWO Seestar S30 Pro új szintre emeli az amatőr csillagászatot: a könnyű, egykezes okostávcsővel már egy kertvárosi ház teraszáról is lélegzetelállító képeket lehet készíteni távoli galaxisokról vagy ködökről, akár kezdőként is...
A japán játékfejlesztők nehéz helyzetbe kerültek: a kisebb stúdióknak nem éri meg Xboxra is fejleszteni, mivel a kereslet minimális, ráadásul a konzolt már a jelentősebb üzletek sem tartják készleten...
Az orvosok szinte semmi esélyt sem láttak arra, hogy a súlyos tüdőrendellenességgel diagnosztizált magzat túlélje, de a szülők kitartó kérésére mertek vállalkozni egy egészen különleges beavatkozásra...
Alzheimer-kór esetén a számok riasztóak: világszerte milliókat érint, az esetek száma rohamosan emelkedik, a költségek már ezermilliárd forint fölött járnak...
Érdemes megvizsgálni, miként alakítja át a Google új fejlesztése az MI-algoritmusok működését — különösen most, amikor a chatbotok és más MI-megoldások iránti kereslet berobbant, de a háttérben hatalmas hardverigények rejtőznek...
🛡 Három országban – az Egyesült Államokban, Mexikóban és Kanadában – rendezik meg a 2026-os FIFA Labdarúgó-világbajnokságot, amelyre előreláthatóan 6,5 millió rajongó érkezik majd a világ minden tájáról...
💸 A Dogecoin ismét a figyelem középpontjába került: a kriptovaluta árfolyama az elmúlt napokban közel 10%-ot erősödött, rövid időre elérve a 11 centes csúcsot, mielőtt 0,105 dollárnál, azaz mintegy 39 forintnál stabilizálódott...
💀 Ilyen eset például, amikor egy szimpla, munkahelyi belső poén rögtön a technológiai világ egyik legérdekesebb pletykájává válik: Sam Altman egy laza megjegyzéssel már pedzegette, hogy hamarosan érkezik a GPT-6 – ráadásul „több goblinnal”, mint eddig bármikor...
Nem hiszem el, de a World Liberty Financial épp most készül elengedni 62 milliárd WLFI tokent, egy közel teljes egyetértés mellett meghozott szavazás után...
Az Amazon egy teljesen új korszakot nyitott meg a vállalati MI-szolgáltatásokban, amikor bejelentette, hogy a legfejlettebb OpenAI-modellek mostantól elérhetők az Amazon Bedrockon, és ezzel véget vetett a felhőszolgáltatói kizárólagosságnak...
Egy vezető nemzetközi kutatócsoportnak először sikerült egy foton állapotát kvantumteleportációval átvinni két, egymástól fizikailag távol lévő kvantumpont között...