Az új Stability AI modell térhatású videóvá alakítja a 2D képeket
A Stability AI bemutatta új modelljét, a Stable Virtual Camera-t, amely 2D képeket alakít térhatású videókká valós mélységgel és perspektívával. A virtuális kamerák a digitális filmkészítésben és 3D animációban használt eszközök, amelyek valós időben rögzítik és navigálják a jeleneteket. A Stability AI szerint az új modell a generatív MI-t ötvözi ezekkel az eszközökkel, nagyobb irányítást és testreszabhatóságot biztosítva.
A Stable Virtual Camera “új nézőpontokat” generál egy jelenetről egy vagy több képből (maximum 32) a felhasználó által meghatározott kameraszögekből. A modell “dinamikus” kamerapályákon vagy előre beállított útvonalakon mozgó videókat készíthet, beleértve a “Spirál”, “Dolly Zoom”, “Mozgás” és “Pásztázás” opciókat.
Korlátok és elérhetőség
A Stable Virtual Camera jelenlegi kutatási előnézeti verziója négyzet (1:1), portré (9:16) és fekvő (16:9) képarányú videókat generálhat, akár 1000 képkocka hosszúságban. A Stability figyelmeztet, hogy bizonyos esetekben alacsonyabb minőségű eredményeket produkálhat, különösen embereket, állatokat vagy “dinamikus textúrákat” (például vizet) ábrázoló képeknél. A modell nem kereskedelmi licenc alatt, kutatási célokra érhető el a Hugging Face platformon.
A Stability AI, a népszerű képgenerálási modell mögött álló cég, nemrég nehéz időszakon ment keresztül. Befektetői, köztük Eric Schmidt és Sean Parker, a Napster alapítója, próbálják megmenteni a vállalatot. Az elmúlt hónapokban új vezérigazgatót neveztek ki, James Cameront beválasztották az igazgatótanácsba, és márciusban bejelentettek egy audiogenerálásra képes MI-modellt is.
🚗 Érdemes megvizsgálni, hogy a Tesla robotaxijai néha valóban nemcsak maguktól közlekednek: bizonyos esetekben emberi operátorok veszik át a távoli irányítást...
🚀 A 2026 tavaszán startoló Artemis II küldetésben négy űrhajós – három amerikai és egy kanadai – tíz napon keresztül utazik majd a világ legerősebb rakétájával a Föld körüli pályán túlra, egészen a Hold közelébe...
📷 Az utóbbi években a Google Fotók folyamatosan átalakult, és most ismét változás jön: eltűnnek az érintős, körberajzolós és firkálós gyorsparancsok az androidos alkalmazásban...
Most őszintén, könyörgöm, észrevetted már, hogy az elektronikai kütyük ára valahogy csak kúszik felfelé, miközben az újak sem feltétlenül jobbak a régieknél?..
Kevés tudományterület tűnik annyira felfoghatatlannak, mint a kvantummechanika. Különösen, ha hozzávesszük az információelmélet összetett matematikáját, amely a modern számítógépek fejlődését is megalapozza...
A Bitcoin árfolyama három éve nem látott közelségbe került a klasszikus vételi zónához, de a piaci adatok szerint ez még nem az a pont, ahol a nagy vevők általában megjelennek...
🚀 Fontos kérdés, hogy mennyit fejlődhetnek a helyi nagynyelvi modellek futtatásának sebessége Apple gépeken – mostantól ugyanis jelentős előrelépés várható...
Kevesen gondolták volna, hogy a Viagra néven elhíresült szer egyik hatóanyaga, a szildenafil, döntő áttörést hozhat egy pusztító gyermekbetegség kezelésében...
A Pixel 10 mobilok láthatóan újabb biztonsági zárat kapnak: a legfrissebb szivárogtatások szerint minden Pixel 10 modell, kivéve a Pixel 10a-t, egy olyan bootloader-frissítést kap, ami ellehetetleníti, hogy a rendszeredet régebbi Android-verzióra visszaállítsd...
😉 Amerikában most minden Google-felhasználó végre megszabadulhat attól a régi, ciki Gmail-címtől, amit még tini fejjel választott, és azóta is kísérti...
Erős nap a történelemben: új császárok tűnnek fel és birodalmak alakulnak át, földrengés és cunami sújtja a Csendes-óceánt, és világcégek születnek a garázsban...
💥 Érdekes felvetés, hogy az NVIDIA legfrissebb DLSS 4.5 frissítése mostantól képes többszörösen több képkockát generálni a GeForce RTX 50-es sorozatú grafikus kártyákon...
🚀 Felmerül a kérdés, hogy valóban elindulhat-e 2028-ban az a történelmi Mars-misszió, amely nem csupán apró robothelikoptereket juttatna el a vörös bolygóra, de a történelem során először atomreaktor-hajtású űrhajó repítené oda őket...
✈ Az amerikai repülőtereken mostanában igazi káosz uralkodik: hiány van személyzetből, a biztonsági sorokról ne is beszéljünk, ráadásul szinte minden héten jön egy újabb légiközlekedési rémtörténet, amitől még a legbátrabb utasok is elgondolkodnak azon, vajon egyáltalán biztonságos-e felszállni...
Korán reggel, 2026. március 31-én az Anthropic egyik belső fejlesztőeszközének, a népszerű Claude Code-nak szinte teljes forráskódja szivárgott ki – egy több mint 59 MB-os JavaScript forrásmap fájlt töltöttek fel véletlenül a nyilvános npm-regiszterbe...
🍕 Mostantól az Alexa Plus-előfizetők végre rendelhetnek ételt pusztán a hangjukkal – hála az új opcióknak, amelyek már a Grubhubbal és az Uber Eats-szel is működnek...
🤔 Ilyen eset például, amikor egy grafikon fut körbe az interneten, amely látványos különbséget mutat meg: hány munkakört érint most az MI, és elméletileg mennyit érinthetne a jövőben...
🙁 Jellemző példa erre, hogy március 12-e óta sok felhasználónál összeomlott a klasszikus Outlook, ha be volt kapcsolva a Microsoft Teams Meeting-bővítmény...
Az észak-karolinai Garnerben, kábé 16 km-re Raleigh-től, már most jobban szoronganak a hús-vér dolgozók, mióta a robotok berobbantak az Amazon egyik hatalmas raktárába...