Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
Egy óriási fekete lyuk újra felébredt, és kitörése most úgy ragyogja be az univerzumot, mintha egy kozmikus vulkán törne felszínre – mindezt közel egymillió fényévnyi kiterjedésben...
🔊 Érdekes felvetés, hogy a tévéműsorok és filmek hangja gyakran érthetetlen, aminek oka részben a beépített tévéhangszórók gyenge minősége, részben pedig a hangsávok egyre összetettebb felépítése...
Fontos fejlemény, hogy az OpenAI jelentős lépést tett a brit fővárosban: megnyitja végleges londoni irodáját, amely több mint 500 munkatárs befogadására alkalmas – ez a jelenlegi létszám kétszerese...
⚡ A StarkWare alaposan átszervezi működését, miután a Starknet nevű hálózatukból származó bevételek több mint 99%-kal estek vissza a 2023 végi csúcsról...
A megszokott VPN-élményt most egy újítás emeli magasabb szintre, amely akár 30%-kal gyorsabb sebességet, fejlettebb adatvédelmet és dedikált, privát szerveroldali alagutat kínál minden egyes felhasználónak...
Egy ügyes támadó vasárnap hajmeresztő, de végül szerencsétlen akciót vitt véghez az Ethereum hálózatán, ahol sikerült 1 milliárd Polkadot tokent (nagyjából 440 milliárd forint értékben) kibocsátania a Hyperbridge egyik hibás szerződésében...
🛡 A tavasz megérkezésével a Google, a Microsoft, az Alibaba és az Nvidia újabb hullámban jelentették meg az általuk fejlesztett nyílt súlyú MI-modelleket...
🧸 Milliós LEGO-lopás, menekülő, játékokkal teli dobozos teherautók, és persze mindenki azt hinné, hogy valami Guy Ritchie-film forog a Mojave-sivatagban...
A bevándorlási és vámhatóság (ICE) hónapok óta próbálja felfedni egy Reddit-felhasználó kilétét, akit azzal vádolnak, hogy nyilvánosan bírálta az ügynökséget...
A Bitcoin árfolyama napok óta erősödött, ráadásul olyan tényezők is támogatták ezt, mint az ETF-beáramlás, a makrogazdasági hátszél vagy a Coinbase-en tapasztalt prémium...
Lényeges, hogy Luxorban, a Karnak templomkomplexumnál dolgozó régészek egy 2000 éves homokkő sztélét tártak fel, amelyen a római császár, Tiberius fáraóként jelenik meg...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. VSep (iPhone/iPad)A VSep egy mesterséges intelligencia alapú alkalmazás, amely képes a zeneszámokból elkülöníteni az éneksávokat...
M. C. Escher képeiben minden benne van, amitől a matematika hirtelen menőnek tűnik: az örökké visszatérő, önmagát ismétlő mintázatok, amelyek egyre kisebb és kisebb méretben folytatódnak a rajzon belül, mintha egy vizuális örökkévalóság lenne...
🎵 Egy lényeges szempont, hogy Steven Soderbergh, aki olyan kasszasikereket rendezett, mint a Forgalom (Traffic), a Tripla vagy semmi (Ocean’s Eleven) vagy a Magic Mike (Magic Mike), ezúttal John Lennon utolsó interjújáról készít dokumentumfilmet...
🤤 Egy új belga kutatás a Goyet-barlangból származó neandervölgyi maradványok alapján megállapította, hogy körülbelül 41 000–45 000 évvel ezelőtt ezek az ősemberek szelektív kannibalizmust folytattak...
Megvizsgálandó, miként fordult meg az MI-verseny szele az Apple javára, miközben a nagy tech cégek dollármilliárdokat öntöttek szuperszámítógépekbe, tréningadatokba és szoftverfejlesztésbe...
Nem csoda, hogy rég nem látott felháborodás söpört végig a Kindle-táboron, miután az Amazon bejelentette: hamarosan véget ér a legöregebb e-olvasók támogatása...
🦁 A héten az Anthropic előállt a Mythos nevű mesterséges intelligenciájával, amely állítólag döbbenetes pontossággal találja meg és használja ki a nulladik napi sérülékenységeket...