
Különösen fontos kiemelni, hogy a Laguna család felépítése szakít a megszokásokkal
A most debütált Laguna család két tagot foglal magában: a Laguna M.1-et és a szabadon terjeszthető Laguna XS.2-t. Előbbi egy zárt, vállalatoknak szánt, 225 milliárd paraméteres óriás, amely a legösszetettebb szoftverfejlesztési problémákra fókuszál, például összetett tervezésre, időben elnyúló feladatokra. Utóbbi, az XS.2 viszont mindössze 33 milliárd paraméterével (ebből 3 milliárd aktív) már egyetlen, felsőkategóriás GPU-n is futtatható – bármiféle internetkapcsolat nélkül, teljes adatbiztonsággal.
Ráadásul az XS.2-t minden fejlesztő letöltheti, és kedvére finomhangolhatja, módosíthatja vagy továbbadhatja akár kereskedelmi célra is, hiszen az Apache 2.0 licenc ezt szinte teljesen szabadon lehetővé teszi – szemben a nagy konkurensek kötöttebb, félig nyitott licenceivel.
A képzés valódi innovációja: mesterszakács, „edzőterem” és szintetikus tudás
A Poolside saját MI-jeit a „Foundry” nevű, teljesen digitális környezetben képezte. A tanulás szíve a Titan szoftver, amely a Muon nevű Picnic-optimalizálót használja. A Muon – akár egy villámgyors magántanár – 15 százalékkal gyorsabban tanítja meg a modelleket, így a 30 billió tokenes adathalmazon is hatékony marad a tanulás.
Az adatokat a szintén úttörő AutoMixer választotta ki: nem egyszerűen az internetről gyűjtött mindent, hanem egy 60 tagú „proxy modellekből” álló raj segítségével keverte ki a tökéletes arányt a kód, a matematika és az általános webes adat között. Az adathalmaz 13 százaléka pedig szintetikusan generált, vagyis MI által előállított példákból áll, ami ritka vagy elérhetetlen tudást is be tud építeni.
A „kiképzés” végén a modellek egy virtuális Reinforcement Learning (RL) „edzőterembe” kerülnek, ahol biztonságos környezetben szereznek valódi tapasztalatot szoftverfejlesztési problémák megoldásában. Ebben a tanulási ciklusban folyamatos visszacsatolást kap a modell: minden javított hiba vagy jó kódrészlet jutalommal jár, így a puszta szövegalkotóból tervező és végrehajtó MI-ügynök válik.
Benchmarkok: apró, de nagyon erős lett az XS.2
Bár a „felnőtt” Laguna M.1 csúcskategóriás, 46,9 százalékos eredményt produkált a fejlett SWE-bench Pro mércén (ez azt vizsgálja, mire képes valós szoftverhibák javításában), az XS.2 mindössze pár százalékkal maradt el tőle, 44,5 százalékkal – ez figyelemre méltó teljesítmény egy jóval kisebb modellen.
A Verified feladatsoron az M.1 72,5 százalékot ért el, megelőzve a sűrűn rétegzett Devstral 2-t, de kicsit elmaradt a vezető Claude Sonnet 4.6-tól. Az XS.2 viszont a saját méretosztályában mindenkit megelőzött: többet produkált, mint a Claude Haiku 4.5 (39,5%) vagy a nagyobb, 31 milliárdos Gemma 4 (35,7%). Terminálalapú feladatokban sem vall szégyent: 30,1 százalékos teljesítménye szoros volt a Haiku 4.5-tel szemben (29,8%).
Ezek az eredmények azt mutatják, hogy a Poolside sikeresen ötvözte az ügynökalapú tanulási technikákat és a szintetikus adatok intelligens felhasználását, és ezzel a „kicsik” is simán versenyezhetnek a nagyok ellen.
Lokalitás, gyorsaság, magánszféra: így fut az XS.2 otthon vagy cégnél
A Laguna XS.2 futtatásához Apple-felhasználóknak minimum 36 GB egységes memória (például MacBook Pro M5 Maxszal, vagy Mac mini, Mac Studio legalább 48–64 GB RAM-mal) kell. A legújabb MacBook Neo viszont 8 GB RAM-mal nem jöhet szóba.
PC-n egy RTX 5090 (32 GB VRAM) vagy legalább egy RTX 4090 (24 GB VRAM) az ajánlott, így akár nehéz feladatokra is alkalmas az XS.2, különösen a támogatott 4 bites kvantálásnak köszönhetően. A teljes modell 70 GB tárhelyet kíván, de egy tömörített verzió ügynökalapú felhasználáshoz már 20–35 GB-tal is beéri.
A felhasználóbarátság és fejlesztői rugalmasság érdekében a Poolside két minialkalmazást is kínál: a terminálalapú ügynököt (pool) és a Shimmer kódfejlesztő webes környezetet. Ezek lehetővé teszik a helyi MI-munkaállomások létrehozását, vagy akár azt, hogy egy mobil képernyőn, instant VM-ből fussanak a komoly fejlesztések is – laptoptól függetlenül.
Miért szánták az XS.2-t a nyílt jövőnek?
A Laguna XS.2-t az Apache 2.0 licenc alá tették, vagyis a teljes modell továbbadható, átdolgozható, akár üzleti céllal is, licencdíj nélkül. Ez éles váltás a nagy MI-szolgáltatók vagy „félig nyílt” riválisokhoz képest. A Poolside szerint a nyugati technológiai ökoszisztémának szüksége van valóban szabad, erős ügynökmodellekre, és a közösségi tesztelés, finomhangolás révén gyorsulhat igazán a fejlődés.
Ezzel a döntéssel nemcsak bebetonozza helyét a szabad MI-piac fő szereplői között, de segít új, harmadik féltől származó termékek és eszközök kifejlesztésében is. Az M.1 ugyan továbbra is API mögött marad, de az XS.2 révén a Poolside megvetette a lábát a nyílt súlyú MI-fejlesztésben.
Az ügynökalapú jövő: kód, önfejlesztés, decentralizáció
A Poolside filozófiája szerint a szoftverfejlesztés a valódi intelligencia legjobb tesztje: tervezés, absztrakció, folyamatok és kreativitás. Ezzel szemben a mai MI-k többsége csak előre adott eszközöket használ, míg a Poolside ügynökei már maguktól írnak és futtatnak kódot problémamegoldásra. A cél nemcsak az újabb intelligenciafokozatok elérése, hanem az „emberiség bősége” – egyfajta visszacsatoláson alapuló, folyamatosan fejlődő rendszer, amely egyszerre aknázza ki az elérhető tudás minden cseppjét, és tanul folyamatosan a való világ hibáiból.
A Laguna XS.2 megjelenése tehát korszakváltás az MI-piacon: olyan, amely az egyedi fejlesztő és az óriásvállalat számára is elérhető ügynök-lehetőségeket hoz, miközben kitolja a nyílt MI-fejlesztés határait – és új irányt mutat arra, hogy milyen is lesz 2026-ban a valóban „ügynökszerűen” dolgozó mesterséges intelligencia.
