
Robotokkal újraírható a hollywoodi történet
A Disney hamarosan elérhetővé teszi az OpenAI Sora-modelljét, amely képes több mint kétszáz karaktert generálni a Disney, a Marvel, a Pixar és a Star Wars univerzumából. A felhasználók maguk állíthatnak össze jeleneteket, amelyeket a Disney+ közvetíthet is. Az együttműködés részeként a Disney 350 milliárd forintot (1 milliárd dollárt) fektet az OpenAI-ba, hogy továbbfejlesszék az előfizetők számára elérhető élményeket, sőt az előfizetők saját tartalmaikat is létrehozhatják. Így ha valaki azt szeretné, hogy Elsa és Hamupipőke együtt küzdjön meg Demónával, egyszerűen megkérheti az MI-t, hogy készítse el neki ezt a pár másodperces jelenetet.
Technológiai kihívások a videógenerálásban
Bár az MI-generált videók fejlődése gyors, rengeteg technikai akadály áll még előttünk. Az MI-rendszerek jelenleg diffúziós módszerrel működnek: egy zajos képből fokozatosan rajzolják ki az adott jelenetet, minden egyes lépésnél pontosabbá téve azt. A videókészítés azonban még nagyobb kihívást jelent, hiszen a karakterek vonásainak és a tereptárgyaknak következetesen kell megjelenniük minden képkockán. Másodpercenként több millió pixel változik, ami hatalmas számítási kapacitást igényel, ezért a hosszabb MI-videók előállítása egyelőre rendkívül drága marad.
A Sora-modell videótömörítéssel és darabolással dolgozik: a videót először leegyszerűsíti, majd képkockákra, azokat pedig kis kockákra bontja, így képes fenntartani a jelenetek koherenciáját. Ez a módszer ahhoz hasonlít, ahogyan a ChatGPT a válaszai során a szavakat összefüggő gondolatokká rendezi.
Mikor jön el a többperces MI-mozi kora?
Az átmenet a pár másodperces klipektől a hosszabb, akár órás alkotásokig lassú és bonyolult folyamat. Minden újabb képkocka további információval terheli meg a rendszert, ráadásul egy valódi MI-alapú tévécsatornához jelenetek közötti vágásra is szükség van. Ha minden Disney+-felhasználó egyszerre generálna saját műsort, az aktuális technológiával a költségek az egekbe szöknének.
Emellett kutatók azon dolgoznak, hogy hatékonyabb módszerekkel gyorsítsák és olcsóbbá tegyék a folyamatot. Egy új megközelítés szerint a modellt több lépésre osztva, képkockánként haladva generálják a videót, így akár percekig is meghosszabbítható. Szakértők egy része szerint jövőre már ötperces videók is készülhetnek, és nem sokkal később elérhető lesz az akár egyórás hossz is. A Google és a Runway vezetői szerint hamarosan eljuthatunk oda, hogy valódi, egész estés filmeket készíthetünk MI segítségével, akár élőben nézve a generálást.
Anyagi és kulturális akadályok
Miközben a technológia fejlődik, pénzügyi és szerzői dilemmák is felmerülnek: ki, mennyiért és hogyan részesedjen a kreatív munkákból származó bevételekből? Az anyagi terhek azonban folyamatosan csökkennek: 1998-ban az adatátviteli sávszélesség ára Mbps-enként 444 ezer forint (1 200 dollár) volt, ma viszont ugyanez már csak néhány forint. Ez tette lehetővé a Disney+ és a Netflix globális sikerét is.
Az MI-videók kulturális elfogadottsága már most heves vitákat vált ki: a 19. századi kritikusok a fényképezést, a 20. században a mozgóképet tartották túl valóságosnak vagy épp művinek, ma pedig az MI-videót tartják annak. Ami azonban biztosnak látszik, hogy hamarosan bárki kipróbálhatja, mire képes az MI, s új alkotói hullám indulhat el.
Mire számíthatunk a jövőben?
A fentiek tükrében nem kérdés, hogy az MI-streaming mind technikai, mind kulturális szempontból forradalmi változásokat hoz. Egyre több emberhez jutnak el ezek az eszközök, és minden eddiginél változatosabb, személyre szabott tartalmak születhetnek – valószínűleg olyan formában, ahogy ma még nem is gondolnánk.
