2026. 01. 14., 08:02

Az MI nem alszik: a Sakana AI forradalmasítja a vállalati ügynököket

Az MI nem alszik: a Sakana AI forradalmasítja a vállalati ügynököket
A japán Sakana AI egyedülálló sikert ért el az AtCoder Heuristic Contesten (AHC058), ahol bonyolult optimalizációs problémákat kellett megoldani – ezek jóval összetettebbek a szokásos teszteknél, amelyeken az MI-ügynökök rutinszerűen átsiklanak. Lényeges hangsúlyozni, hogy a Sakana ALE-Agent nevű MI-rendszere önállóan, mindössze 4 óra alatt több száz megoldást generált, tesztelt, majd fejlesztett, miközben 800 emberből – köztük a legjobb programozókból – is a legjobbnak bizonyult. Ez a teljesítmény egy olyan korszakot vetít előre, ahol a vállalati környezetekhez igazodó MI-ügynökök már nemcsak végrehajtók, hanem önmagukat optimalizáló problémamegoldók lehetnek.

Miért más az ALE-Agent szemlélete?

Az AHC058 verseny feladata egy, a tényleges vállalati folyamatokhoz hasonló géppark irányítása volt – gépek almákat termelnek, más gépek pedig az almatermelő gépeket építik. Az volt a cél, hogy adott lépésszám alatt a lehető legnagyobb teljesítményt érjék el. A hagyományos vállalati problémákban általában egy domain szakértő meghatározza a célfüggvényt (azaz: pontozó (scorer)), majd mérnökök fejlesztenek optimalizáló algoritmusokat hozzá – ez gyakran időigényes és nehezen általánosítható feladat.

Emberi oldalról a jól bevált stratégiák közé tartozik a „mohó” (greedy) módszer (lépésről lépésre a legjobbnak tűnő lehetőséget választják), majd a „szimulált hűtés” (simulated annealing), ahol a már meglévő terven apró, véletlen változtatásokat próbálnak ki. Azonban, ha az első terv alapja hibás, ezek a próbálkozások sem képesek jelentős eredményre. Ebből adódóan az ALE-Agent újítása abban rejlik, hogy a statikus indítás helyett dinamikus újjáépítést végez: saját maga alakít ki egy „vitalitás” fogalmát, értéket rendel a még üzemképtelen komponensekhez is, vagyis előre is képes reagálni, és a jövőbeni potenciált már most számításba veszi. Így nemcsak a jelenlegi lehetőségekre, hanem a jövőbeli értékek halmozódására alapozza döntéseit. Ez lényegében a kamatos kamat hatásának hasznosítása a gépi optimalizációban.

Ezenfelül az ügynök folyamatosan reflektál a próbálkozásaira: szöveges „felismeréseket” generál minden új körben, így képes emlékezni a hibás irányokra, elkerülni a korábbi zsákutcákat, és hosszabb távon is következetes stratégiát követni. A mohó módszert nem szüntette meg, hanem közvetlenül beépítette a szimulált hűtés fázisába is, és így kerüli el, hogy helyi maximumokban ragadjon.

Új korszak kezdete a vállalati optimalizációban

Ez a megközelítés szinte készen átültethető a vállalati informatikába, ahol az ügyfelek már rendelkeznek világos célfüggvényekkel. Ma még ritka, hogy egy cég saját mérnökei képesek ilyen bonyolult optimalizációt programozni, de az ALE-Agent demonstrálja, mire képes az MI: az ember meghatározza a célt, az MI pedig mindent hozzáigazít. A hangsúly már nem a fejlesztőkapacitáson, hanem a pontos, mérhető célokon van. Ha a vállalat meg tudja mérni, mit akar, az MI optimalizálja azt – legyen szó útvonaltervezésről, szerverterhelés-elosztásról vagy erőforrás-allokációról.

A Sakana AI szerint ez valóban demokratizálja az optimalizációt: a nem technikai hátterű ügyfelek is könnyedén variálhatják a feltételeket, amíg ideális eredményt nem kapnak. Maga az ALE-Agent azonban még fejlesztés alatt áll, jelenleg csak belső projektek és pilot-együttműködések részese, a cég nem tervezi széles körű megosztását.

Az igazi áttörést azonban a jövő MI-ügynökei jelenthetik, amelyek már saját maguk alakítják ki a célfüggvényeiket is. Ez különösen ott lehet hasznos, ahol az emberek sem tudják könnyen meghatározni az ideális kiindulópontot.

Mennyi az intelligencia ára?

Az ALE-Agent négyórás futtatása hozzávetőleg 470 ezer forintnyi (1 300 USD) számítási költséget igényelt, több mint 4 000, MI-modelleken végrehajtott gondolkodási művelettel. Bár egyszeri feladatra ez soknak tűnhet, valójában egy-egy sikeres optimalizáció akár több millió forintnyi éves megtakarítást hozhat, tehát az arányok rendkívül kedvezőek lehetnek.

Lényeges hangsúlyozni, hogy miközben a tokenek ára csökken, a teljes vállalati költés mégis nőhet – a cégek ugyanis inkább elmélyítik a keresést, hogy a legjobb eredményt kapják meg. A sikerhez tehát nemcsak az MI-k okosodása, hanem a gondolkodási keretek bővítése és a hosszabb „tervezési idő” biztosítása is elengedhetetlen. Ez adja meg a lehetőséget arra, hogy az MI tényleg felvegye a versenyt az emberi szakértelemmel.

2025, adminboss, venturebeat.com alapján

Legfrissebb posztok

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...

kedd 11:34

A Starlink mellett veszélyesen darabokra hullott egy kínai rakéta

Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...

kedd 11:01

Az EU megnyitná az Android MI-jét, a Google szerint indokolatlan

Az Európai Unió legújabb döntése szerint a Google-nek jóval szélesebbre kell tárnia az Androidon működő MI-szolgáltatások kapuját...

kedd 10:47

Az MI-adatközpontokért dúl a harc: két texasi kisváros játszmája

🛠 Felmerül a kérdés, hogy egy texasi porfészekből hogyan válik országos viták színterévé, amikor a mesterségesintelligencia-infrastruktúra-építési láz eléri a vidéki közösségeket...