A mesterséges intelligencia, amely már a jövőt is látja

A WorldVLA egy új generációs MI-modell, amely nemcsak képeket és nyelvet, hanem emberi cselekvéseket is képes értelmezni és előállítani. Az új rendszer az úgynevezett Vízió–Nyelv–Akció (Vision-Language-Action, VLA) modell és a világmodell ötvözésével egyetlen keretrendszerben működik. Képes előrejelezni a jövőbeli képeket úgy, hogy figyelembe veszi a mozgásokat és a képi tartalmat is. Így jobban érti a környezet fizikai szabályait, és ennek köszönhetően pontosabban tud akciókat generálni.

A világmodell és az akciómodell közös ereje

A WorldVLA nem csupán a világmodellek vagy az önálló akciómodellek funkcióit valósítja meg: a kettő összehangolásával jelentősen jobb teljesítményt ér el. Az akciómodell az aktuális képi információk alapján dönti el a következő lépést, miközben segíti a világmodell vizuális generálását. Az együttműködés révén hatékonyabbá válik a jövőbeli események előrejelzése és az akciók tervezése.

Új figyelemmaszk az előrejelzési hibák ellen

Megfigyelhető, hogy az akciómodellek hajlamosak romlani, amikor maguk által generált cselekvéssorozatokat hoznak létre: a korábbi lépések hibái átterjednek a következőkre. Ennek orvoslására a kutatók figyelemmaszkoló stratégiát vezettek be, amely a pillanatnyi akció generálásakor szelektíven elrejti a korábbi mozdulatokat. Ennek köszönhetően jelentősen javult a cselekvéssorozat pontossága, különösen az úgynevezett akcióblokk-generálási feladatban.

2025, adrienne, arxiv.org alapján


Legfrissebb posztok

Earendel, az univerzum hajnalcsillaga vagy csak űrbéli délibáb

MA 15:27

Earendel, az univerzum hajnalcsillaga vagy csak űrbéli délibáb

💫 Az univerzum kutatói újabb izgalmas felfedezést tettek, amikor a Hubble űrteleszkóp egy különleges gravitációs lencséződésnek köszönhetően 2022-ben rábukkant egy fényforrásra, amely közvetlenül az ősrobbanás után, a világegyetem születésével...

Az olcsóbb Xbox Cloud Gaming közelebb van, mint gondolnád

MA 14:51

Az olcsóbb Xbox Cloud Gaming közelebb van, mint gondolnád

A Microsoft ismét felvetette az ötletet, hogy elérhetőbbé teszi az Xbox Cloud Gaminget. Jelenleg ez a szolgáltatás csak az Xbox Game Pass Ultimate előfizetés részeként használható, ami havi...

Az ember formájú robotok cirkusza: bénázás és bunyó Kínában

MA 14:26

Az ember formájú robotok cirkusza: bénázás és bunyó Kínában

🤖 Kínában először rendezik meg a Humanoid Robotok Világjátékait (World Humanoid Robot Games), ahol több mint 500 robot, 16 országból érkezve méri össze erejét futásban, fociban, kick-boxban és számos...

Az OpenAI árazása miatt megindulhat az MI nagy árháborúja

MA 14:01

Az OpenAI árazása miatt megindulhat az MI nagy árháborúja

Az OpenAI mindenkit meglepett, amikor a héten néhány nap alatt két új MI-modellt adott ki, ráadásul elérhető áron. Az új GPT-5-öt a cég vezérigazgatója, Sam Altman, a világ...

Az MI-őrület miatt 15 ezermilliárd forint ment veszendőbe

MA 13:51

Az MI-őrület miatt 15 ezermilliárd forint ment veszendőbe

💸 Az amerikai vállalatok elképesztő, 12 250 és 14 000 milliárd forint (35–40 milliárd USD) közötti összeget költöttek generatív MI-kezdeményezésekre, mégis alig tudnak felmutatni kézzelfogható eredményeket. Egy friss kutatás...


MA 13:26

Az MI feltalálója, Mark Rober beköltözik a Netflixre

A világhírű YouTuber és egykori NASA-mérnök, Mark Rober hamarosan a Netflixen is megcsillogtatja tudományos kísérleteit. Rober különleges, edukatív videóival milliókat szórakoztat; többek között a hírhedt bűzös glitterbombát is...

Az MI végre emlékszik: Claude már a múltbeli beszélgetéseket is előhívja

MA 13:01

Az MI végre emlékszik: Claude már a múltbeli beszélgetéseket is előhívja

A legújabb fejlesztésnek köszönhetően Claude, az Anthropic MI chatbotja már képes előhívni a korábbi beszélgetéseidet – de csak ha te is akarod. Ez a funkció elsősorban a Max,...

Az ázsiai technológiai óriások zuhanása: A SoftBank drámai esése

MA 12:51

Az ázsiai technológiai óriások zuhanása: A SoftBank drámai esése

A SoftBank Group részvényei szerda reggel 9,2%-ot estek Tokióban, magukkal rántva az ázsiai technológiai vállalatok többségét is. Az eladási hullám Amerikából indult, miután az MI-sztár Nvidia gyengén teljesített,...

Az igazi viking titok: nem csak raboltak, kereskedtek is a Közel-Kelettel

MA 12:26

Az igazi viking titok: nem csak raboltak, kereskedtek is a Közel-Kelettel

🪑 1100 éves viking kincsleletet találtak Észak-Angliában, amely egészen új képet fest a vikingek gazdagságáról. A Bedale-kincs néven ismert lelet szó szerint mesél: arany karddísz, ezüst ékszerek, valamint 29...