A Runway áttörése: percekig tartó koherencia az MI-ben

A Runway áttörése: percekig tartó koherencia az MI-ben
A Runway bemutatta GWM-1 névre keresztelt, első világmodelljét, amely jelentős lépés a vállalat részéről, eddig ugyanis leginkább videógenerálásban jeleskedett. Az MI-fejlesztés új szakaszába lép: a hangsúly egyre inkább a kifinomultságon van, nem csupán a méreten. A GWM-1 fejlesztésével a Runway is beszállt abba a versenybe, ahol az MI-alapok megteremtése a cél.

Három az egyben: az új GWM-1 modellek

A GWM-1 egy összefoglaló név, amely három autoregressziós modellt takar. Ezek mindegyike a Runway Gen-4.5 szövegből videót előállító modelljén alapszik, majd speciális, témaspecifikus adatokkal továbbképezték őket különböző felhasználási területekre. A modellekkel teljes virtuális világokat lehet definiálni, szabályokkal és fizikai elvekkel, de akár valós idejű cselekvéseket vagy változásokat is be lehet állítani, például kameramozgást vagy környezeti módosításokat. Különösen fontos kiemelni, hogy ezek a modellek képesek több percen át koherensen, logikus összefüggésben fenntartani az eseményeket, ami nagy előrelépés.

Alkalmazási lehetőségek: játékoktól a robotokig

A lehetséges felhasználási területek között megtalálható a játékipari fejlesztők számára az előzetes vizualizáció, a VR-környezetek generálása vagy épp oktatási célú történelmi helyszínek feltérképezése. Egy másik fontos felhasználás, hogy ezek a világmodellek MI-ügynökök – például robotok – képzésére is alkalmasak. Ilyen eset például a GWM Robotics részmodell alkalmazása, amellyel mesterségesen generált adatokkal egészíthető ki a már meglévő robotikai adathalmaz, legyen szó új tárgyakról, feladatokról vagy környezetekről.

Az MI-modellek lehetővé teszik olyan tréninghelyzetek létrehozását is, amelyeket nehéz volna a valóságban biztonságosan megismételni, például extrém időjárási körülmények között. Emellett a vezérlési stratégiák szimulációját is elősegítik, mielőtt élesben tesztelnék azokat. A cég Python SDK-t is fejlesztett, amely külön kérésre már elérhető.

Avatárok, platform, technikai ugrás

A harmadik modell, a GWM Avatars, a generatív videót és beszédet ötvözi: természetes mozgású, emberhez hasonló avatárokat generál, amelyek beszélgetés közben is hitelesen mimikáznak. Ezek alkalmasak hosszabb interakciókra is, minőségromlás nélkül – ha ez valóban megvalósul, az igazi mérföldkő. Ez a funkció a jövőben válik elérhetővé a webalkalmazásban és az API-n keresztül is.

A Runway célja, hogy sokféle feladatra alkalmas, multifunkciós modelleket hozzon létre, amelyek képesek eltérő környezetek, ügynökök és alkalmazások szimulálására. Bár világszimulációk már régóta léteznek, az ilyen általános célú megközelítés viszonylag új törekvés – sokan ezt az általános mesterséges intelligencia (Artificial General Intelligence, AGI) felé vezető útnak vélik, bár erre nincs egyértelmű bizonyíték.


Éles verseny: van esélye a Runway-nek?

A Runway szándékosan nem használta az AGI-megközelítést, szemben például a DeepMinddal. Ugyanakkor a cég alapítója, Cristobal Valenzuela úgy tekint a GWM-1-re, mint egy fontos lépésre az univerzális szimuláció felé – ez viszont egyelőre még rendkívül tág fogalom, amelynek nincs egységes meghatározása.

Összességében elmondható, hogy a Runway új irányba indult: a világmodellek piacán immár olyan nagy techcégekkel kell versengenie, amelyeknek sokkal nagyobb erőforrásaik vannak. Bár videógenerálásban korábban egyedülálló előnyre tett szert, most sokkal keményebb terepen kell helytállnia, például a robotikában vagy az élettudományokban, ahol már kialakult a piac, és egyre több a befektetés.

Új funkciók és partnerségek

A vállalat nemrégiben jelentette be, hogy a Gen-4.5 videógeneráló modelljét továbbfejlesztette natív hanggal, hangmódosítással és többjelenetes videószerkesztéssel. Emellett stratégiai megállapodást kötött a CoreWeave felhőszolgáltatóval, amelynek keretében a Runway a jövőben a CoreWeave NVIDIA GB300 NVL72 szerverparkját használja MI-modellek betanítására és üzemeltetésére.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 11:17

A stresszes patkányok gyorsabban válnak függővé a kannabisztól

🐼 A stresszes patkányok sokkal hajlamosabbak újra és újra kannabiszt fogyasztani, mint kevésbé ideges társaik...

MA 11:02

A Control folytatása sarkaiból fordítja ki Manhattant

🧙 A Remedy Entertainment végre leleplezte a régóta várt Control: Resonánst (Control: Resonant), amely a 2019-ben megjelent, nagy sikert aratott paranormális akciójáték folytatása lesz...

MA 10:57

A Marson gyorsabban jár az idő – új űrkutatási kihívások

Mára egyértelművé vált, hogy Einstein mégiscsak jól gondolta: az idő tényleg nem egyforma mindenhol az univerzumban...

MA 10:52

A React2Shell réme: egy kattintás, óriási kár

⚠ 2025. december 3-án minden megváltozott a React Server Components (RSC) világában: kiderült, hogy a React2Shell (CVE-2025-55182) nevű súlyos sebezhetőség teljesen kiszolgáltatta a szervereket a távoli kódvégrehajtási támadásoknak...

MA 10:43

Az évtizedek óta várt új Mega Man végre megérkezett

🎮 A Capcom 2027-ben visszahozza Mega Mant, méghozzá a sorozat 40. évfordulójára készülő vadonatúj játékkal, a Mega Man: Kettős felülvezérlés (Dual Override) címmel...

MA 10:39

Az LG StanByMe 2: a hordozható tévé, ami rabul ejt

Egy lényeges szempont, hogy nem minden technológiai újítás talál célba elsőre...

MA 10:29

Jön az új gigász: 70 TB-os HDD a láthatáron

A Seagate bejelentette, hogy hamarosan forgalomba hozza az első, 70 TB kapacitású, 3,5 colos HDD-t, elsőként a világon...

MA 10:23

A James Webb végre leleplezte az univerzum óriáscsillagait

💫 A James Webb űrteleszkóp lenyűgöző felfedezéssel szolgál: eddig ismeretlen, óriási tömegű csillagokat talált a GS 3073 nevű, ősi galaxisban, amely mintegy egymilliárd évvel az ősrobbanás után alakult ki...

MA 10:15

Az orkák új szövetségesekkel vadásznak lazacra?

Az elmúlt időszakban több érdekes megfigyelés is arra utal, hogy a kardszárnyú delfinek (orkák) és a fehéroldalú delfinek szokatlan szövetséget alkothatnak a lazacvadászatban Brit Columbia partjainál...

MA 09:51

A hővel csábító növények titkai: élet a virágzás előtt

Általában elválaszthatatlan fogalmaknak tűnnek a virág és a beporzás, pedig évmilliókkal a virágok megjelenése előtt a növények már sikeresen vonzották az állatokat – csak nem színes szirmokkal, hanem forrósággal...

MA 09:43

Megérkezett az első otthoni depressziókezelő készülék

💡 Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az első olyan eszközt, amely otthon is használható depresszió kezelésére...

MA 09:30

A római sírok új rejtélye: ujjlenyomatok az idő mélyéről

🗿 Közel 1800 évvel ezelőtt a mai Britannia területén élő rómaiak különös temetkezési szertartást alkalmaztak: folyékony gipszpasztát kentek az elhunyt testére, még mielőtt eltemették volna...

MA 09:23

Az OpenAI szabad kezet kapott a Disney-hősökkel

👑 A Disney három évre exkluzív licencet adott több mint 200 karakterére az OpenAI-nak, így mostantól a Sora videós MI és a ChatGPT Images hivatalosan is rajzolt és animált formában generálhat Disney-, Pixar-, Marvel- és Star Wars-karaktereket...

MA 09:16

Az új ChatGPT 5.2: végre itt az okosabb MI

Sokan már napi szinten használják a ChatGPT-t tanulásra és munkára, így fontos kérdés, hogy egy új verzió mennyit javít a megbízhatóságon és a mindennapi hasznosságon...

MA 09:08

A CentreStack súlyos kriptográfiai hibája nyit kaput az adatlopásnak

A hackerek új, eddig dokumentálatlan sérülékenységet használnak ki a Gladinet CentreStack és Triofox fájlmegosztó rendszereiben, amellyel távoli kódfuttatást érhetnek el...

MA 09:02

A 3D-s huzalozás küszöbén a 10 000 qubites MI-chipek

Fontos kérdés, hogyan lehet a kvantumszámítógépek számítási teljesítményét jelentősen növelni, miközben a fizikai méretük nem nő arányosan...

MA 08:57

Az összeomlás ára a kriptovilágban: 15 év börtön Do Kwon-nak

Do Kwon, a dél-koreai kriptovállalkozó 15 év börtönt kapott az Egyesült Államokban, miután két digitális valutája, a TerraUSD és a Luna 2022-ben összesen 14 ezer milliárd forint (kb...

MA 08:52

Az ausztrál tinik lázadnak: Túl kemény a közösségi média-tilalom?

👏 A közelgő ausztrál közösségi média-tilalom komoly hullámokat vetett, hiszen a kormány egyre komolyabb lépéseket tesz a fiatalok megóvása érdekében...