A Runway áttörése: percekig tartó koherencia az MI-ben

A Runway áttörése: percekig tartó koherencia az MI-ben
A Runway bemutatta GWM-1 névre keresztelt, első világmodelljét, amely jelentős lépés a vállalat részéről, eddig ugyanis leginkább videógenerálásban jeleskedett. Az MI-fejlesztés új szakaszába lép: a hangsúly egyre inkább a kifinomultságon van, nem csupán a méreten. A GWM-1 fejlesztésével a Runway is beszállt abba a versenybe, ahol az MI-alapok megteremtése a cél.

Három az egyben: az új GWM-1 modellek

A GWM-1 egy összefoglaló név, amely három autoregressziós modellt takar. Ezek mindegyike a Runway Gen-4.5 szövegből videót előállító modelljén alapszik, majd speciális, témaspecifikus adatokkal továbbképezték őket különböző felhasználási területekre. A modellekkel teljes virtuális világokat lehet definiálni, szabályokkal és fizikai elvekkel, de akár valós idejű cselekvéseket vagy változásokat is be lehet állítani, például kameramozgást vagy környezeti módosításokat. Különösen fontos kiemelni, hogy ezek a modellek képesek több percen át koherensen, logikus összefüggésben fenntartani az eseményeket, ami nagy előrelépés.

Alkalmazási lehetőségek: játékoktól a robotokig

A lehetséges felhasználási területek között megtalálható a játékipari fejlesztők számára az előzetes vizualizáció, a VR-környezetek generálása vagy épp oktatási célú történelmi helyszínek feltérképezése. Egy másik fontos felhasználás, hogy ezek a világmodellek MI-ügynökök – például robotok – képzésére is alkalmasak. Ilyen eset például a GWM Robotics részmodell alkalmazása, amellyel mesterségesen generált adatokkal egészíthető ki a már meglévő robotikai adathalmaz, legyen szó új tárgyakról, feladatokról vagy környezetekről.

Az MI-modellek lehetővé teszik olyan tréninghelyzetek létrehozását is, amelyeket nehéz volna a valóságban biztonságosan megismételni, például extrém időjárási körülmények között. Emellett a vezérlési stratégiák szimulációját is elősegítik, mielőtt élesben tesztelnék azokat. A cég Python SDK-t is fejlesztett, amely külön kérésre már elérhető.

Avatárok, platform, technikai ugrás

A harmadik modell, a GWM Avatars, a generatív videót és beszédet ötvözi: természetes mozgású, emberhez hasonló avatárokat generál, amelyek beszélgetés közben is hitelesen mimikáznak. Ezek alkalmasak hosszabb interakciókra is, minőségromlás nélkül – ha ez valóban megvalósul, az igazi mérföldkő. Ez a funkció a jövőben válik elérhetővé a webalkalmazásban és az API-n keresztül is.

A Runway célja, hogy sokféle feladatra alkalmas, multifunkciós modelleket hozzon létre, amelyek képesek eltérő környezetek, ügynökök és alkalmazások szimulálására. Bár világszimulációk már régóta léteznek, az ilyen általános célú megközelítés viszonylag új törekvés – sokan ezt az általános mesterséges intelligencia (Artificial General Intelligence, AGI) felé vezető útnak vélik, bár erre nincs egyértelmű bizonyíték.


Éles verseny: van esélye a Runway-nek?

A Runway szándékosan nem használta az AGI-megközelítést, szemben például a DeepMinddal. Ugyanakkor a cég alapítója, Cristobal Valenzuela úgy tekint a GWM-1-re, mint egy fontos lépésre az univerzális szimuláció felé – ez viszont egyelőre még rendkívül tág fogalom, amelynek nincs egységes meghatározása.

Összességében elmondható, hogy a Runway új irányba indult: a világmodellek piacán immár olyan nagy techcégekkel kell versengenie, amelyeknek sokkal nagyobb erőforrásaik vannak. Bár videógenerálásban korábban egyedülálló előnyre tett szert, most sokkal keményebb terepen kell helytállnia, például a robotikában vagy az élettudományokban, ahol már kialakult a piac, és egyre több a befektetés.

Új funkciók és partnerségek

A vállalat nemrégiben jelentette be, hogy a Gen-4.5 videógeneráló modelljét továbbfejlesztette natív hanggal, hangmódosítással és többjelenetes videószerkesztéssel. Emellett stratégiai megállapodást kötött a CoreWeave felhőszolgáltatóval, amelynek keretében a Runway a jövőben a CoreWeave NVIDIA GB300 NVL72 szerverparkját használja MI-modellek betanítására és üzemeltetésére.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 09:51

A hővel csábító növények titkai: élet a virágzás előtt

Általában elválaszthatatlan fogalmaknak tűnnek a virág és a beporzás, pedig évmilliókkal a virágok megjelenése előtt a növények már sikeresen vonzották az állatokat – csak nem színes szirmokkal, hanem forrósággal...

MA 09:43

Megérkezett az első otthoni depressziókezelő készülék

💡 Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az első olyan eszközt, amely otthon is használható depresszió kezelésére...

MA 09:30

A római sírok új rejtélye: ujjlenyomatok az idő mélyéről

🗿 Közel 1800 évvel ezelőtt a mai Britannia területén élő rómaiak különös temetkezési szertartást alkalmaztak: folyékony gipszpasztát kentek az elhunyt testére, még mielőtt eltemették volna...

MA 09:23

Az OpenAI szabad kezet kapott a Disney-hősökkel

👑 A Disney három évre exkluzív licencet adott több mint 200 karakterére az OpenAI-nak, így mostantól a Sora videós MI és a ChatGPT Images hivatalosan is rajzolt és animált formában generálhat Disney-, Pixar-, Marvel- és Star Wars-karaktereket...

MA 09:16

Az új ChatGPT 5.2: végre itt az okosabb MI

Sokan már napi szinten használják a ChatGPT-t tanulásra és munkára, így fontos kérdés, hogy egy új verzió mennyit javít a megbízhatóságon és a mindennapi hasznosságon...

MA 09:08

A CentreStack súlyos kriptográfiai hibája nyit kaput az adatlopásnak

A hackerek új, eddig dokumentálatlan sérülékenységet használnak ki a Gladinet CentreStack és Triofox fájlmegosztó rendszereiben, amellyel távoli kódfuttatást érhetnek el...

MA 09:02

A 3D-s huzalozás küszöbén a 10 000 qubites MI-chipek

Fontos kérdés, hogyan lehet a kvantumszámítógépek számítási teljesítményét jelentősen növelni, miközben a fizikai méretük nem nő arányosan...

MA 08:57

Az összeomlás ára a kriptovilágban: 15 év börtön Do Kwon-nak

Do Kwon, a dél-koreai kriptovállalkozó 15 év börtönt kapott az Egyesült Államokban, miután két digitális valutája, a TerraUSD és a Luna 2022-ben összesen 14 ezer milliárd forint (kb...

MA 08:52

Az ausztrál tinik lázadnak: Túl kemény a közösségi média-tilalom?

👏 A közelgő ausztrál közösségi média-tilalom komoly hullámokat vetett, hiszen a kormány egyre komolyabb lépéseket tesz a fiatalok megóvása érdekében...

MA 08:43

A VS Code-ot rejtett trójaiakkal fertőző bővítmények terjednek

🐛 Egy ügyes kibertámadási kampány már február óta fertőzi a fejlesztőket, miután 19 rosszindulatú bővítmény jelent meg a VS Code Marketplace-en...

MA 08:29

Az adatvédelmi rémálom: több mint 10 ezer Docker Hub-kép titkot szivárogtat

Több mint 10 000 Docker Hubon elérhető konténerképben találtak olyan érzékeny adatokat, amelyeknek sosem kellett volna nyilvánosságra kerülniük...

MA 08:23

A lenyűgöző anyag, amelyet szinte lehetetlen előállítani

💫 Ez a jelenség jól illusztrálható azzal, hogy Londonban, a Royal Brompton Kórházban korábban a tüdőszkennelés akár 45 percig is eltartott, ahol a pácienseknek mozdulatlanul, a fejük felett összekulcsolt kézzel kellett feküdniük...

MA 08:14

Az egész Föld összes háza végre 3D-ben látható

Tudósok elkészítették az első globális 3D-térképet az emberi lakóépületekről, amelynek neve World Settlement Footprint 3D...

MA 08:08

A Fortnite visszatért a Google Playre – az Apple még nem enged

Az Epic Games legendás battle royale-ját, a Fortnite-ot újra letölthetik az amerikai Android-felhasználók, miután bírósági döntés kötelezte a Google-t az alkalmazás visszaengedésére...

MA 08:02

Az Oracle nyakig eladósodik az MI‑őrületben

Az Oracle gyorsítja a kiadásait és bérleti szerződéseit, hogy lépést tartson az MI‑alapú felhőszolgáltatások iránti döbbenetes kereslettel...

MA 07:57

A mesterséges intelligencia már önállóan böngészik a Brave-ben

A Brave böngésző új, MI-alapú böngészési funkcióval kísérletezik, amely lehetővé teszi, hogy az adatvédelembarát Leo asszisztens automatikusan végezzen el különböző feladatokat...

MA 07:50

A Google új funkciójával a szelfidben próbálhatod fel a ruhákat

👗 Mostantól elég egy szelfi ahhoz, hogy az MI-vel működő Google-ruhapróbálót használd, nem kell felállni, és egész alakos képet készíteni...

MA 07:44

A brit adatvédelmi hatóság lecsap: bírság a LastPassnak adatlopásért

A brit adatvédelmi hatóság, az ICO, 1,2 millió font (kb. 545 millió forint) pénzbírságot szabott ki a LastPass jelszókezelő szolgáltatóra, miután 2022-ben mintegy 1,6 millió brit felhasználó adatait lopták el egy sorozatos biztonsági incidens során...