A Runway új Gen-4 modellje: Végre következetes MI videók születhetnek?

A Runway új Gen-4 modellje: Végre következetes MI videók születhetnek?
Az MI-videókat fejlesztő startup, a Runway bejelentette legújabb videószintézis-modelljét. A Gen-4 névre keresztelt modell számos kulcsfontosságú problémát megold az MI-alapú videók készítésében. A legfontosabb újítás a következetes szereplők és tárgyak megjelenítése különböző jelenetekben. Ha láttál már MI-vel készült rövidfilmeket, biztosan észrevetted, hogy ezek inkább álomszerű, tematikusan összefüggő képsorok, mintsem valódi narratívák. A Runway állítása szerint a Gen-4 képes fenntartani a szereplők és tárgyak következetességét, ha a felhasználó egyetlen referenciaképet biztosít a kérdéses karakterről vagy tárgyról a Runway felületén. A cég példavideókat tett közzé, amelyeken ugyanaz a nő jelenik meg különböző jelenetekben, ugyanaz a szobor pedig teljesen eltérő környezetekben tűnik fel, miközben különböző fényviszonyok mellett is nagyjából ugyanúgy néz ki.

Egyedi pozíció egy zsúfolt piacon

A Runway 2023 februárjában tette elérhetővé videószintézis-termékének első nyilvános verzióját. A Gen-1 alkotások még inkább kuriózumnak számítottak, mintsem a kreatív szakemberek számára hasznos eszközöknek, de a későbbi fejlesztések lehetővé tették korlátozott használatukat valódi projektekben.

Például a technológiát használták a “Minden, mindenhol, mindenkor” (Everything Everywhere All At Once) című film egyik jelenetében, ahol két szikla beszélget egymással egy sziklaszirten, valamint a “Stephen Colbert Late Show” (The Late Show with Stephen Colbert) című műsorban is, vizuális poénokhoz.

Míg sok konkurens startupot MI-kutatók vagy szilícium-völgyi vállalkozók hozták létre, a Runway-t 2018-ban a New York-i Egyetem Tisch Művészeti Iskolájának hallgatói alapították: a chilei Cristóbal Valenzuela és Alejandro Matamala, valamint a görög Anastasis Germanidis.

Ez volt az egyik első cég, amely használható videógeneráló eszközt tett a nagyközönség számára elérhetővé, és csapatuk alapvető hozzájárulásokat tett a Stable Diffusion modell fejlesztéséhez.

Támogató eszköz, nem önálló kreatív termék

Bár a versenytársak, például az OpenAI, jóval nagyobb költségvetéssel rendelkeznek, a Runway egyedi pozíciót alakított ki. Míg a legtöbb versenytárs általános célú videokészítő eszközöket kínál, a Runway a kreatív szakemberekre, például tervezőkre és filmkészítőkre összpontosít. Olyan eszközöket fejlesztett, amelyek kiegészítik a már meglévő kreatív munkafolyamatokat.

Ez a megközelítés elősegítette, hogy a Runway megállapodást kössön a Lionsgate filmstúdióval. A megállapodás keretében a filmstúdió engedélyezte, hogy a modelljeiket a filmkönyvtáruk anyagaival tanítsák be, cserébe a Runway egyedi eszközöket biztosított számukra a gyártásban és az utómunkálatok során.

Ugyanakkor a Runway – a Midjourney-hez és másokhoz hasonlóan – perek célpontjává vált. Művészek vádolják őket azzal, hogy illegálisan használták fel alkotásaikat a modellek betanításához.

Mit hoz a jövő a Gen-4 számára?

A Gen-4 állítólagos fejlesztései a kreatív felhasználók panaszaira adott válaszok, miszerint ezek a videószintézis-eszközök a következetesség hiánya vagy a jelenet megértésének korlátai miatt csak korlátozottan használhatók. Versenytársak, például a Pika, szintén próbálkoztak e korlátok leküzdésével, de kevesebb sikerrel.

A Runway bejelentése szerint a Gen-4 már elérhető “minden fizetős előfizetéssel és vállalati ügyfelek számára”. A nem vállalati előfizetések havi 15 dollártól (kb. 5400 Ft) akár havi 95 dollárig (kb. 34 000 Ft) terjednek, éves előfizetés esetén 20% kedvezménnyel. Egy vállalati fiók éves díja 1500 dollár (kb. 540 000 Ft).

Az előfizetések havonta akár 2250 kreditet biztosítanak a felhasználóknak, ám mivel az MI-videók generálása gondos válogatást igényel, sok generált anyag használhatatlan, valószínű, hogy e mennyiséggel nem készíthető túl sok használható videó. A havi 95 dolláros egyéni előfizetés tartalmaz egy “Felfedező Módot”, amely korlátlan, de lassabb tempójú generálást tesz lehetővé.

2025, adminboss, arstechnica.com alapján

További részletek itt. (Link a weboldalra)

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

kedd 20:34

A gőték láthatatlan genetikai csapdába estek

Ami először apróságnak tűnt, komoly evolúciós rejtéllyé nőtte ki magát a tarajos és márványos gőték körében...

kedd 20:17

Áttörés: már a legritkább betegségeket is gyógyítják

Egy mindössze hat hónapos baba, KJ Muldoon lett az első a világon, aki személyre szabott CRISPR-génszerkesztéses kezelést kapott egyedi genetikai mutációjára...

kedd 20:01

A tini hacker rács mögött: 64 millió ellopott adat

Spanyol rendőrök Barcelonában elfogtak egy 19 éves fiatalt, aki kilenc különböző cég rendszereibe tört be, majd 64 millió ember személyes adatait próbálta eladni az interneten...

kedd 19:49

Jön az új chipgyártó, vége az MI energiazabálásnak?

⚡ Érdekes felvetés, hogy az MI gyors fejlődése nemcsak hatékonysági, hanem egyre inkább energiagazdálkodási kihívás elé állítja a világot...

kedd 19:33

Az ősi csillagok átírják a Tejútrendszer történetét

⭐ Felmerül a kérdés, hogy mennyire ismerjük valójában saját galaxisunk, a Tejút, történetét...

kedd 19:02

Az Instacart trükkös árazása: ki fizet többet ugyanazért?

Egy friss kutatás döbbenetes eredményeket hozott az Instacart árképzéséről: a felhasználók ugyanabból az üzletből származó, ugyanazon termékre akár öt különböző árat is láthattak...

kedd 18:50

Az MI-lázban most éri meg igazán videókártyát venni

Érdekes felvetés, hogy a mesterséges intelligencia iránti kirobbanó kereslet néhány hónapon belül alaposan felhajthatja a videókártyák árait...

kedd 18:34

Az űrbe költöznek az adatszerverek – forradalom vagy vakvágány?

🚀 Például egyre többen foglalkoznak azzal a gondolattal, hogy a nagy teljesítményű adatközpontokat a Föld helyett az űrben helyezzék el...

kedd 18:18

Az univerzum rejtett rendje: áttörés a fraktális káosz feltárásában

🌈 Az univerzum felszínes rendjével szemben ott lüktet a káosz: véletlenek, apró kilengések formálnak mindent, a hatalmas galaxisoktól a leghétköznapibb jégvirágig...

kedd 17:49

Leállt a Microsoft Copilot – pórul jártak az európai felhasználók

⚠ Az elmúlt órákban jelentős hiba akadályozta Európa-szerte a Microsoft Copilot MI-asszisztens használatát, így a felhasználók nem érhetik el sem a copilot...

kedd 17:33

Az év animációs szenzációja: jön a Zootropolis 2 streamingre

🐶 Zootropolis 2 (Zootopia 2), a Disney nagysikerű animációs filmjének folytatása, várhatóan 2026 elején érkezik meg az otthonokba...

kedd 16:50

Kínába csempészték az Nvidia GPU-kat: 60 milliárdos botrány

📦 Az amerikai hatóságok ismét komoly, Kínához köthető csempészési hálózatot számoltak fel, amelyen keresztül exportkorlátozás alá eső MI-chipeket szállítottak volna Kínába és más tiltott országokba...

kedd 16:34

Az Android-nyomkövetők hadat üzennek az AirTagnek

🔎 Az Apple AirTag népszerűségét látva hamarosan új nyomkövető eszközök jelennek meg Androidra...

kedd 16:20

A Meta zsonglőrködik: a Llama után érkezik az Avocado-káosz

🥑 Meta, a Facebook anyavállalata az elmúlt évben jelentős irányváltáson ment keresztül a mesterséges intelligencia fejlesztésében...

kedd 16:02

Újabb vágás: a Standard Chartered tovább farag a bitcoin-előrejelzésén

📈 A Bitcoin árfolyamának emelkedése elakadt, különösen a gyenge negyedik negyedéves teljesítmény után...

kedd 15:49

Az Intel és a Tata óriási dobásra készül Indiában

🚀 Az Intel új szövetséget kötött az indiai óriásvállalattal, a Tatával, és közösen vizsgálják majd a chipgyártás lehetőségeit India első félvezetőgyárában...

kedd 15:17

A Google új MI-alkalmazása már vásárlásra is csábít

🛒 A Google MI-alapú próbafülke-alkalmazása, a Doppl új felfedező hírfolyammal bővült, ahol bárki azonnal be is szerezheti a kiválasztott ruhákat...

kedd 15:02

A mesterséges intelligencia már átírja a nyelvünket?

Egyre több moderátor és kutató aggódik amiatt, hogy az emberek beszéde feltűnően hasonlít az MI által generált nyelvezethez...