MA 08:08

A Sakana 7B-je vezényli a GPT-5-öt, Claude-ot és Geminit

A Sakana 7B-je vezényli a GPT-5-öt, Claude-ot és Geminit
A Sakana AI kutatói áttörő megközelítéssel új alapokra helyezték az MI-modellek együttműködését. Egy kis méretű, mindössze 7 milliárd paraméteres nyelvi modelljük, az RL Conductor, képes önállóan irányítani és összehangolni több, eltérő képességű, nagy teljesítményű MI-t, így együtt használja a GPT-5, a Claude Sonnet 4 és a Gemini 2.5 Pro modelljeit. Ez az automatikus koordinátor nemcsak hogy túlteljesíti az egyedi élvonalbeli modelleket a legnehezebb problémák megoldásában, de mindezt töredék költséggel és kevesebb API-hívással teszi.

Statikus rendszerek csapdájában

A jelenlegi MI-alapú ügynökhálózatok merev sémái valójában komoly akadályai a fejlődésnek. Bár a nagy nyelvi modellek óriási rejtett képességekkel rendelkeznek, ezek kiaknázása jelenleg kézműves módszerekre, manuálisan felépített munkafolyamatokra támaszkodik. Az ilyen rendszerek a valóságban gyorsan elvéreznek, amikor eltérő, sokféle igény lép fel – márpedig az üzleti életben ez a normális eset. Emiatt a változó felhasználói elvárások kezelése, valamint a különféle kompetenciájú modellek ésszerű összehangolása sokszor lehetetlen vállalkozás a statikus, keményen kódolt csővezetékek mellett.

A másik alapprobléma, hogy nincs olyan egyetlen modell, amely minden feladatra optimális lenne. Egyesek kiválóak tudományos gondolkodásban, mások a kódírás vagy éppen matematikai logika terén kiemelkedőek. Mivel ezek a készségek kiegészítik egymást, a megfelelő modellkombinációk előzetes, manuális meghatározása gyakorlatilag lehetetlen. Az ideális rendszer ezért képes lenne magától felismerni a problémát, majd dinamikusan kiosztani a részfeladatokat a legmegfelelőbb „szakértőnek” a modellcsoportból.

Hogyan karmesterkedik az RL Conductor?

Az RL Conductor szakít a korábbi, merev keretekkel. Nevéhez hűen igazi karmesterként irányítja az MI-ügynökök zenekarát: összetett problémákat darabol részfeladatokra, kialakítja az ügynökök közötti kommunikációs hálót, majd menedzseli az együttműködést. A folyamat során nem előre bekódolt sémákból dolgozik, hanem minden egyes feladathoz személyre szabott, természetes nyelvű munkautasításokat generál. Meghatározza, ki melyik részt csinálja, milyen előzményeket, válaszokat vehet figyelembe, így rugalmas, igényre szabott munkafolyamatokat teremt.

A modell nem emberi tervezéssel tanulja meg ezt, hanem megerősítéses tanulási (RL) módszerrel. Tanítás során konkrét problémát kap, egy végrehajtó modellekből álló csoportot, majd visszacsatolást arról, hogy a válasza mennyire helyes. Az öntanuló folyamat során véletlenszerű próbálkozásokkal fedezi fel, mely ügynökhálózatok, utasítások, részfolyamatok hozzák a legjobb eredményeket. Emiatt automatikusan alkalmazza az olyan bonyolult stratégiákat is, mint a célzott promptolás, az iteratív finomítás vagy akár a metaprompt-optimalizálás – és mindezt anélkül, hogy a fejlesztőknek kézzel kellene programozniuk a folyamatot.

Mi mindent tud már most?

A Conductor teszteléséhez a kutatók a Qwen2.5-7B modellt igazították saját keretrendszerükhöz. A tanuló „karmester”-modell egy legfeljebb öt lépésből álló ügynökfolyamatot tervezett hét különféle MI felhasználásával: három zárt rendszerű (Gemini 2.5 Pro, Claude Sonnet 4, GPT-5) és négy nyílt forráskódú modellel (például DeepSeek-R1-Distill-Qwen-32B, Gemma3-27B, Qwen3-32B).

A Conductor felülmúlta az összes önálló élvonalbeli modellt és a legfejlettebb, többügynökös, ember-tervezte megoldásokat is a legnehezebb logikai, matematikai és kódolási teszteken. Átlagosan 77,27%-os pontosságot ért el, 93,3%-ot az AIME25 matematikai teszten, 87,5%-ot a GPQA-Diamond teszten és 83,93%-ot a LiveCodeBench programozási benchmarkon.

Ami igazán lenyűgöző: miközben a hagyományos rendszerek (például a MoA) átlagosan több mint 11 000 tokent égetnek el kérdésenként, a Conductor mindössze 1820 tokent használt, és átlagosan három lépésből oldotta meg a feladatot. Könnyű kérdésekre gyorsan, akár egyetlen ügynökkel válaszolt, de bonyolultabb programozási problémákhoz teljesen önálló, többlépcsős, dedikált tervezés-végrehajtás-ellenőrzés folyamatokat épített.

Ráadásul felismerte, hogy az élvonalbeli modellek különbözőek: a Gemini 2.5 Pro-t és a Claude Sonnet 4-et gyakran nagyívű tervezőként, a GPT-5-öt sokszor optimalizáló végrehajtóként alkalmazta. Volt olyan eset is, amikor minden tervezést rábízott a Gemini 2.5 Pro-ra, és az határozta meg az ügynökök munkáját.


Már termékben bizonyít: Sakana Fugu

A kutatásban leírt prototípusból már kész üzleti termék született. Sakana Fugu néven két változatban – Mini a gyors reagálásra, Ultra a kiemelt teljesítményre – érhető el. Ezek OpenAI-kompatibilis API-n keresztül zökkenőmentesen illeszthetők bármilyen vállalati rendszerbe, nem kell külön bajlódni több szolgáltatóval vagy kézi routinggal.

A Fugu már most segíti a fejlesztést, a mély kutatást, a stratégiaalkotást, sőt vizuális feladatokat is, például prezentációk készítését. A rendszer megfelelő biztonsági korlátokkal működik, kockázatai pedig nem nagyobbak, mint bármely csúcskategóriás, zárt MI-szolgáltatásé.

Emiatt azoknak a csapatoknak a leghasznosabb, akik már érzik, hogy túl sok idő megy el arra, hogy manuálisan instruálják MI-ügynökeiket. Egyszerű, helyben futó feladatokra továbbra sem éri meg, de ahol sok a specializált modell és összetett elvárás, ott az ilyen dinamikus vezérlés egyértelműen előnyös.

Az MI-modellek választékának bővülésével a statikus, merev keretrendszerek ideje lejárt. A végkövetkeztetés mindenkit meglepett: a jövőben ezek az önszervező vezérlők nemcsak szöveg- és kódkörnyezetben, de akár fizikai robotikai rendszerekben is alapvető szerepet töltenek majd be.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 09:29

A tojás akár 27%-kal csökkentheti az Alzheimer-kór kockázatát

Érdemes megvizsgálni, hogy milyen tényezők hatnak az időskori agyműködésre, és miként lehet a demencia kialakulását megelőzni...

MA 09:16

A NASA Curiosityja robotkarján ragadt marsi kővel egy hétig küzdött

Tipikus eset, amikor egy látszólag egyszerű feladat váratlanul komoly akadállyá válik: a NASA Curiosity marsjárója egy egész héten át küzdött, hogy megszabaduljon egy makacs kőtől, amely a robotkar végére szorult...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/8

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Voxaro (iPhone/iPad)A Voxaro egy innovatív alkalmazás, amely valós időben alakítja át a beszédet jól szerkesztett, tiszta szöveggé...

MA 09:08

Az MI-ügynökök megoldhatják a kripto felhasználói gondjait?

💻 A kriptovilágban régóta visszatérő probléma, hogy a digitális pénztárcák és a stabilcoinok használata sokak számára még mindig nehézkes, és csak kevesen találták meg bennük a mindennapi pénzügyi élet valódi értelmét...

MA 09:02

Az univerzális Apple Watch-kábel, amit felesleges kütyünek hittem, utazáskor nélkülözhetetlen

🚀 A hosszú évek alatt megszokott útitársaim közé tartoznak a különböző töltők és kábelek, hiszen repülős üzleti utakra vagy akár néhány órás autózásokra mindig vinnem kell minden eszközöm töltőjét...

MA 08:57

Az újabb amerikai–iráni feszültség padlóra küldte a Bitcoint

💸 A kriptovaluták piacán ismét erős hullámzás tapasztalható: a Bitcoin árfolyama gyorsan visszaesett a 29,5 millió forint (79 000 dollár) körüli szintre, miután az Egyesült Államok csapást mért iráni célpontokra...

MA 08:50

Az ausztrálok hajnali háromkor csaphatnak le a Steam Controllerre

Erre utal például az, hogy az új Steam Controller pillanatok alatt elfogyott Ausztráliában, a keddi megjelenését követően...

MA 08:36

A következő stabilcoin-boomot a nagyvállalatok és az MI-ügynökök vezetik

🥇 A stabilcoinok világa teljesen új korszakba lép: multinacionális cégek egyre szélesebb körben használják határokon átnyúló pénzmozgásokhoz, miközben a mesterséges intelligenciával működő ügynökök is önálló kifizetéseket hajtanak végre a blokkláncon...

MA 08:29

A Kobo új, bohókás tokjai gyönyörűek, de hol az új hardver?

A 2026-os New York-i BookCon rendezvényen mutatta be a Kobo legújabb limitált szériás tokjait, amelyek színes és játékos dizájnnal hívják fel magukra a figyelmet...

MA 08:02

Az új MI három évvel előbb azonosítja a hasnyálmirigyrákot, mint az orvosok

🧠 Fontos kérdés, hogy a hasnyálmirigyrákot mikor sikerül felfedezni, hiszen ez életet menthet...

MA 07:57

Az amerikaiaknak globális kriptólikviditást hozna a Binance.US újjáélesztése

💰 Fontos kérdés, hogy mikor férhetnek hozzá ismét az amerikai felhasználók a globális kriptovaluta-piac legjobb áraihoz...

MA 07:43

Az on-chain adatvédelem és elszámoltathatóság kéz a kézben járhatnak

🔑 A blokklánc-technológia világa egyszerre kínál teljes átláthatóságot és kihívásokat a felhasználói magánélet területén...

MA 07:37

Az MI új korszaka: a ZAYA1-8B, a takarékos áttörés

⚡ Ebből következően érdemes megérteni, hogy a mesterséges intelligencia világában az óriási, egyre nagyobb modellek mellett egyre nagyobb figyelmet kapnak azok a fejlesztések, amelyek a kisebb, hatékonyabb és széles körben elérhető megoldásokra építenek...

MA 07:28

A brazil fa lehet a COVID–19 elleni új csodafegyver

🌱 brazil kutatók egy őshonos fa leveléből származó természetes vegyületeket azonosítottak, amelyek több fronton támadják a COVID–19-et okozó vírust...

MA 07:22

A bíróságon csap össze Taylor Swift és a vegasi showgirl

💪 Taylor Swift újra bíróság előtt találja magát, ezúttal egy Las Vegas-i revütáncosnő miatt, aki azt állítja, hogy az énekesnő ellopta az Egy showgirl vallomásai (Confessions of a Showgirl) márkát...

MA 07:01

Az önvezető teherautó, amely sofőr és fülke nélkül megdöbbentette a fuvarozóipart

Egy kaliforniai start-up, a Humble Robotics mutatta be a Humble Haulert, amely minden eddigi elképzelést felülmúl azzal, hogy teljesen vezetőfülke nélkül képes szállítani árut...

MA 06:57

Az abszurd GameStop–eBay történet: a vezért eBay-ezésért tiltották ki, majd visszaengedték

A GameStop vezérigazgatója, Ryan Cohen egészen szokatlan fordulatokat produkált, amikor eBay-felvásárlási tervei kapcsán bizarr akcióba kezdett: játékosokat célzó relikviákat és sportritkaságokat kezdett el árulni az eBay-en – állítólag azért, hogy finanszírozza magát a felvásárlást...

MA 06:50

A Coinbax 20 ezer dollárt kaszált a Consensus Miami PitchFesten stablecoin-megfelelésért

A Consensus Miami konferencián a Coinbax zsebelte be a 7,2 millió forintos fődíjat, miután bemutatta azt a szoftvert, amely jelentősen egyszerűsítheti a stabilcoin-tranzakciók megfelelőségi ellenőrzését...

MA 06:43

A kriptolassulás odacsap: elmaradt Q1 után 5%-ot zuhan a Coinbase

A friss pénzügyi jelentés komoly csalódást okozott a befektetőknek: a Coinbase váratlan veszteséget szenvedett el az első negyedévben, és elmaradt a bevételi várakozásoktól is...

MA 06:36

Miért nem forog a Webb által felfedezett óriásgalaxis?

A James Webb-űrtávcső friss megfigyelései minden előzetes várakozást felülírnak: a távoli XMM-VID1-2075 galaxis a világegyetem kezdeti korszakából származik, ám egészen meglepő módon nem mutat semmiféle forgásra utaló nyomot...

MA 06:30

Az Anthropic újítása: álmodó MI-ügynökök, akik hibáikból tanulnak

San Franciscóban zajló második Anthropic-konferencián látványos eredményekkel mutatkozott be a Claude platform legnagyszabásúbb frissítése, amelynek középpontjában egy új, „álmodás” (dreaming) nevű fejlesztés áll...

MA 06:22

A lehetetlen bolygópár, amely mégis létezik

A Tejútrendszer egyik távoli pontján, mintegy 190 fényévre a Földtől, kutatók egy különleges bolygópárosra bukkantak...

MA 06:06

Történelmi események a mai napon (Május 8.)

Ma olyan nap, amikor fordult a történelem kereke: Jeanne d’Arc áttörte Orléans ostromát, véget ért az európai háborúskodás a V-E Day napján, és az Egészségügyi Világszervezet megerősítette a himlő felszámolását...

csütörtök 21:58

A Forza Horizon 6 eddig megerősített autófelhozatala – íme!

🚗 Idén ősszel minden eddiginél nagyobb durranásnak ígérkezik a Forza Horizon 6, amelyben ezúttal Japán vadregényes vidékein, városaiban, hegyeiben és tengerpartjain száguldozhatunk, méghozzá a valaha volt legnagyobb választékkal...

csütörtök 21:46

A Yakuza-sorozat eredettörténete: ilyen lesz a Stranger Than Heaven

🗿 Az RGG Studio legújabb játéka, a Különösebb a mennyországnál (Stranger Than Heaven) a 20...

csütörtök 21:34

A kontextus nélkül könnyen összeomlik az MI – így orvosolható

Ilyen eset például, amikor a vállalat abban reménykedik, hogy a legmodernebb MI-modell végre áttörést hoz: precíz, személyre szabott eredményeket vár tőle – de ehelyett egységes, sablonos vagy akár teljesen irreleváns válaszokat kap...

csütörtök 21:01

Az XRP 1,42 dollár alá csúszott: kitörést lesnek a kereskedők

Miután több napon át próbált 1,45 USD (kb. 535 HUF) felett maradni, az XRP elbukott, és hirtelen, 25%-os visszaeséssel 1,42 USD (kb...

csütörtök 20:57

Az iráni hekkerek zsarolóvírus-kampánnyal adatokat lopnak a Microsoft Teamsen

Érdekes fejlemény, hogy államilag támogatott iráni hekkerek egyre kifinomultabb módszerekkel támadnak, és közben mindent megtesznek azért, hogy álcázzák valódi szándékaikat...

csütörtök 20:46

Az Anthropic szkennerei mindent átengedtek: a kártékony kód tesztfájllal jutott be

⚠ Hétköznapi helyzet fejlesztőknél: fut egy Anthropic Skill-szkenner, amely átvizsgálja a ClawHubról vagy a skills...