A Runway új Gen-4 modellje: Végre következetes MI videók születhetnek?

A Runway új Gen-4 modellje: Végre következetes MI videók születhetnek?
Az MI-videókat fejlesztő startup, a Runway bejelentette legújabb videószintézis-modelljét. A Gen-4 névre keresztelt modell számos kulcsfontosságú problémát megold az MI-alapú videók készítésében. A legfontosabb újítás a következetes szereplők és tárgyak megjelenítése különböző jelenetekben. Ha láttál már MI-vel készült rövidfilmeket, biztosan észrevetted, hogy ezek inkább álomszerű, tematikusan összefüggő képsorok, mintsem valódi narratívák. A Runway állítása szerint a Gen-4 képes fenntartani a szereplők és tárgyak következetességét, ha a felhasználó egyetlen referenciaképet biztosít a kérdéses karakterről vagy tárgyról a Runway felületén. A cég példavideókat tett közzé, amelyeken ugyanaz a nő jelenik meg különböző jelenetekben, ugyanaz a szobor pedig teljesen eltérő környezetekben tűnik fel, miközben különböző fényviszonyok mellett is nagyjából ugyanúgy néz ki.

Egyedi pozíció egy zsúfolt piacon

A Runway 2023 februárjában tette elérhetővé videószintézis-termékének első nyilvános verzióját. A Gen-1 alkotások még inkább kuriózumnak számítottak, mintsem a kreatív szakemberek számára hasznos eszközöknek, de a későbbi fejlesztések lehetővé tették korlátozott használatukat valódi projektekben.

Például a technológiát használták a “Minden, mindenhol, mindenkor” (Everything Everywhere All At Once) című film egyik jelenetében, ahol két szikla beszélget egymással egy sziklaszirten, valamint a “Stephen Colbert Late Show” (The Late Show with Stephen Colbert) című műsorban is, vizuális poénokhoz.

Míg sok konkurens startupot MI-kutatók vagy szilícium-völgyi vállalkozók hozták létre, a Runway-t 2018-ban a New York-i Egyetem Tisch Művészeti Iskolájának hallgatói alapították: a chilei Cristóbal Valenzuela és Alejandro Matamala, valamint a görög Anastasis Germanidis.

Ez volt az egyik első cég, amely használható videógeneráló eszközt tett a nagyközönség számára elérhetővé, és csapatuk alapvető hozzájárulásokat tett a Stable Diffusion modell fejlesztéséhez.

Támogató eszköz, nem önálló kreatív termék

Bár a versenytársak, például az OpenAI, jóval nagyobb költségvetéssel rendelkeznek, a Runway egyedi pozíciót alakított ki. Míg a legtöbb versenytárs általános célú videokészítő eszközöket kínál, a Runway a kreatív szakemberekre, például tervezőkre és filmkészítőkre összpontosít. Olyan eszközöket fejlesztett, amelyek kiegészítik a már meglévő kreatív munkafolyamatokat.

Ez a megközelítés elősegítette, hogy a Runway megállapodást kössön a Lionsgate filmstúdióval. A megállapodás keretében a filmstúdió engedélyezte, hogy a modelljeiket a filmkönyvtáruk anyagaival tanítsák be, cserébe a Runway egyedi eszközöket biztosított számukra a gyártásban és az utómunkálatok során.

Ugyanakkor a Runway – a Midjourney-hez és másokhoz hasonlóan – perek célpontjává vált. Művészek vádolják őket azzal, hogy illegálisan használták fel alkotásaikat a modellek betanításához.

Mit hoz a jövő a Gen-4 számára?

A Gen-4 állítólagos fejlesztései a kreatív felhasználók panaszaira adott válaszok, miszerint ezek a videószintézis-eszközök a következetesség hiánya vagy a jelenet megértésének korlátai miatt csak korlátozottan használhatók. Versenytársak, például a Pika, szintén próbálkoztak e korlátok leküzdésével, de kevesebb sikerrel.

A Runway bejelentése szerint a Gen-4 már elérhető “minden fizetős előfizetéssel és vállalati ügyfelek számára”. A nem vállalati előfizetések havi 15 dollártól (kb. 5400 Ft) akár havi 95 dollárig (kb. 34 000 Ft) terjednek, éves előfizetés esetén 20% kedvezménnyel. Egy vállalati fiók éves díja 1500 dollár (kb. 540 000 Ft).

Az előfizetések havonta akár 2250 kreditet biztosítanak a felhasználóknak, ám mivel az MI-videók generálása gondos válogatást igényel, sok generált anyag használhatatlan, valószínű, hogy e mennyiséggel nem készíthető túl sok használható videó. A havi 95 dolláros egyéni előfizetés tartalmaz egy “Felfedező Módot”, amely korlátlan, de lassabb tempójú generálást tesz lehetővé.

2025, adminboss, arstechnica.com alapján

További részletek itt. (Link a weboldalra)

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 16:33

A 4000 milliárdos gigadeal: az IBM viszi a Confluentet

💰 A technológiai világ ismét felforrósodott: az IBM bejelentette, hogy 11 milliárd dollárért (kb...

MA 16:17

A rák titkos trükkje, amitől mindig visszatér

A rák elleni gyógyszerekre kialakuló rezisztencia továbbra is az egyik legnagyobb kihívás az onkológiában...

MA 16:02

Az Eli Lilly csodaszere: olvadnak a kilók, múlik a térdfájás

Érdemes megvizsgálni, milyen áttörést hozott az Eli Lilly legújabb elhízás elleni gyógyszere, a retatrutide, amely a legfrissebb, késői fázisú vizsgálatok alapján minden eddiginél nagyobb testsúlycsökkenést eredményez...

MA 15:49

Az agy csapdája: így tartanak fogva a rossz szokások

🔒 Fontos kérdés, hogy miért válik oly gyorsan megszokássá egy ártatlan reggeli rutin, miközben máskor képtelenek vagyunk elhagyni káros beidegződéseinket...

MA 15:34

Az orosz tűzóriás visszavág: újjászületett a Bezimjanny

Oroszország távoli Kamcsatka-félszigetén található a Bezimjanny, amely 1956 márciusában hatalmas robbanással szétvetette önmagát, és szó szerint eltüntette eredeti csúcsát...

MA 15:02

Az új MI-kódoló háborút hirdet az óriásoknak

🚀 A francia Mistral AI vadonatúj MI-megoldással rukkolt elő: a Devstral 2 egy nyílt súlyú, 123 milliárd paraméteres kódolási modell, amelyet kifejezetten autonóm szoftvermérnöki eszköznek szán...

MA 14:50

Az online gyermekbántalmazás tombol – Van ebből kiút?

Érdekes felvetés, miszerint a digitális világ folyamatosan változik, miközben az online térben minden eddiginél nagyobb fenyegetést jelent a gyermekek szexuális kizsákmányolása és bántalmazása...

MA 14:33

Az Adobe MI-őrülete bejött: szárnyal a cég

Az Adobe 2025-ben újabb rekordévet zárt, 8 400 milliárd forintos bevételt ért el, ami 11 százalékos növekedést jelent az előző évhez képest...

MA 14:18

A rejtélyes Trója titkai: egy új mozaik mindent átír

🌍 Kivételesen jó állapotban fennmaradt római kori mozaikot tártak fel Nagy-Britanniában, amely a trójai háború ábrázolásával lepte meg a kutatókat...

MA 14:02

Az óceán mélye rejtélyesen tünteti el a szenet

🌊 Különösen említést érdemel, hogy a legújabb kutatások alapjaiban rengetik meg eddigi tudásunkat arról, miként raktározódik a szén az óceánok sötét mélységeiben...

MA 13:49

Az áradások árnyékában: Ázsia jövője a klímaváltozás markában

Az elmúlt hónapban Indonéziát és Srí Lankát sújtó két trópusi vihar összesen közel 1600 ember életét követelték, miután hatalmas esőzéseket és földcsuszamlásokat okoztak...

MA 13:01

Az MI és a robotika új korszakot hoz a brit kutatólaborokban

A Google DeepMind jövőre megnyitja első automatizált kutatólaborját az Egyesült Királyságban, ahol MI-t és robotikát vetnek be a kísérletekhez...

MA 12:34

Az Adobe Photoshop mostantól ingyen használható a ChatGPT-ben

Érdemes megérteni: forradalmi változás történt. Az Adobe legnépszerűbb kreatív és produktivitási alkalmazásai, köztük a Photoshop, az Express és az Acrobat, mostantól közvetlenül elérhetők a ChatGPT-ben...

MA 12:17

Az eltűnt Mars-szonda rejtélye: a NASA tanácstalan

A NASA váratlanul elveszítette a kapcsolatot a Maven nevű űrszondával, amely már több mint tíz éve kering a Mars körül...

MA 12:01

Az életmentő Mars-szonda leállt: bajban a NASA

A NASA egyik kulcsfontosságú marsi műholdja, a MAVEN, december 6-án váratlanul elnémult, amikor a Mars túlsó oldalán járt – azon az oldalon, amelyik nem néz a Föld felé...

MA 11:49

Az Apple TV és az Apple Music egyszerre omlott össze

Délután néhány felhasználó számára elérhetetlenné váltak az Apple Music és az Apple TV, ráadásul az Apple TV Channels funkciója sem működött...

MA 11:33

Az új Teams riaszt, ha gyanús a külső forgalom

A Microsoft egy friss biztonsági funkción dolgozik a Teamsben, amely képes elemezni a gyanús forgalmat külső domainekkel, ezzel segítve az IT-adminisztrátorokat a potenciális biztonsági kockázatok kiszűrésében...

MA 11:17

A DroidLock lecsap: androidos telefonokat zárol, váltságdíjat követel

Egy frissen felfedezett androidos kártevő, a DroidLock zárolja az áldozatok készülékeit, miközben az SMS-ekhez, híváslistákhoz, névjegyekhez, hangfelvételekhez is hozzáfér, sőt, akár törölheti is az adatokat...