OpenAI új eszközökkel készül az MI-ágensek munkaerőpiacra lépésére
Az MI-ipar minden tőle telhetőt megtesz, hogy valósággá váljanak az ágensek (esetleg ügynökök) – olyan MI-vezérelt szoftverek, amelyek több lépésből álló műveleteket hajthatnak végre a felhasználó nevében. Számos technológiai vállalat hangsúlyozta az ágens-jellegű funkciókat az utóbbi időben, és januárban Sam Altman, az OpenAI vezérigazgatója megemlítette, hogy 2025 lesz az az év, amikor az MI-ágensek csatlakoznak a munkaerőhöz.
Az OpenAI azon dolgozik, hogy ezt az ígéretet valósággá változtassa. Kedden az OpenAI bemutatott egy új API-t, amelyet arra terveztek, hogy segítse a szoftverfejlesztőket olyan MI-ágensek létrehozásában, amelyek képesek önállóan feladatokat végrehajtani a vállalat MI-modelljeit használva. A Responses API végül leváltja a jelenlegi API-t, amelyet az OpenAI 2026 első felében tervez nyugdíjazni.
MI-ágensek a munkahelyi folyamatokban
Az új ajánlattal a felhasználók olyan egyedi MI-ágenseket fejleszthetnek, amelyek integrálódnak egy fájlkereső segédprogrammal, amely gyorsan ellenőrzi a vállalati adatbázisokat (az OpenAI ígérete szerint anélkül, hogy ezeken a fájlokon tanítaná modelljeit), és végrehajthatnak a GPT-4-en keresztül elérhető funkciókhoz hasonló feladatokat. A fejlesztők hozzáférhetnek a háttérben működő Computer-Using Agent (CUA) modellhez is, amely lehetővé teszi olyan feladatok automatizálását, mint az adatbevitel és egyéb műveletek.
A Responses API-t használó fejlesztők hozzáférhetnek ugyanazokhoz a modellekhez, amelyek a GPT-4o keresést és a GPT-4o mini keresést működtetik. Ezek a modellek képesek kérdésekre válaszolni és forrásokat idézni válaszaikban.
Pontosabb keresési eredmények
Ez azért figyelemreméltó, mert az OpenAI szerint a hozzáadott webes keresési képesség drámaian javítja MI-modelljeinek ténybeli pontosságát. Az OpenAI tesztelési oldalán, amely a konfabulációs arányt hivatott mérni, a GPT-4o kereső 90 százalékot ért el, míg a GPT-4o mini kereső 88 százalékot – mindkettő lényegesen felülmúlta a nagyobb, keresés nélküli GPT-4.5 modellt, amely 63 százalékot ért el.
Ezen fejlesztések ellenére a technológiának még mindig jelentős korlátai vannak. A CUA webhelyek megfelelő navigálásával kapcsolatos problémáin túl a javított keresési képesség nem oldja meg teljesen az MI konfabulációk (halluzás) problémáját, a GPT-4o kereső még mindig 10 százalékban követ el ténybeli hibákat.
A Responses API mellett az OpenAI kiadta a nyílt forráskódú eszközkészletet is, amely ingyenes eszközöket biztosít a fejlesztőknek a modellek belső rendszerekkel való integrálásához, biztonsági óvintézkedések megvalósításához és az ágensek tevékenységének figyelemmel kíséréséhez. Ez az eszközkészlet az OpenAI korábbi, több ágens egyidejű kezelésére szolgáló keretrendszerének kiadását követi.
Még mindig a korai szakaszában járunk az MI-ágensek területén, és a dolgok valószínűleg gyorsan fognak fejlődni. Azonban jelenleg az MI-ágens mozgalom továbbra is ki van téve a valószerűtlen állításoknak, amint azt a héten egy kínai startup ágens platformja is bizonyította, amely nem tudta teljesíteni ígéretei nagy részét, kiemelve a promóciós állítások és a gyakorlati funkcionalitás közötti tartós szakadékot ebben a kialakulóban lévő technológiai kategóriában.
Áprilisban igazán izgalmas időszak vár az Xbox Game Pass előfizetőire: díjnyertes folytatások, zseniális új független címek, klasszikusok ráncfelvarrott kiadásai és persze jó néhány addiktív gyöngyszem kerül fel a platformra...
A mesterséges intelligencia fejlesztésének egyik legfőbb kihívása, hogy olyan autonóm ügynökök épüljenek, amelyek képesek alkalmazkodni a környezet változásaihoz anélkül, hogy az alapul szolgáló nagy nyelvi modellt újra kellene tanítani...
💉 Míg az elmúlt években a Lyme-kór egyre komolyabb egészségügyi problémává nőtte ki magát, most új remény villant fel: a Pfizer és a Valneva közös fejlesztése révén egy hatékony vakcina kerülhet a piacra, amely segíthet megfékezni ezt a kullancsok által terjesztett betegséget...
☀️ Úgy tűnik, a Samsung most komolyan fejleszti a Now Brief funkcióját: a kiszivárgott képernyőfotók alapján már nemcsak az aktuális nap időjárását mutatja majd, hanem egy teljes, hétnapos előrejelzést is, részletesen megadva a napi maximumokat és minimumokat, valamint ikonokkal illusztrálva a várható időjárást...
🔒 A kontinens legnagyobb vasúti utazásait szervező Eurail kénytelen volt elismerni, hogy tavaly december végén hackerek több mint 300 ezer ügyfél személyes adataihoz jutottak hozzá...
Pár hónap múlva már a Pixel 11 szériát foghatjuk kézbe – és bármilyen hihetetlen, de ezek a telefonok lehetnek az elsők, amelyek megkapják a Samsung vadonatúj M16 OLED paneljét...
🤯 Emellett a Google Home felhasználói egyre nagyobb számban tapasztalnak komoly problémákat a Gemini nevű, frissített hangalapú asszisztenssel, amelyet már 16 új országban vezetik be...
⚠ Az OpenAI felfüggesztette az Egyesült Királyságba tervezett Stargate nagyléptékű MI-infrastruktúra kiépítését, miután makacs energiaár-emelkedés és bizonytalan szabályozási környezet húzta keresztbe a számításaikat...
Jól mutatja, hogy egyetlen elütés is okozhat milliárdos kárt: a második legnagyobb dél-koreai kriptotőzsde, a Bithumb munkatársai februárban tévedésből egy promóció során „BTC”-t írtak „KRW” helyett, így 249 nyertesnek nem 620 000 forintnyi összeget, hanem fejenként 620 000 bitcoint, összesen több mint 40 milliárd dollárt (14 320 milliárd forintot) írtak jóvá belső rendszerükben...
🥗 Ez a jelenség jól illusztrálható azzal, hogy a látszólag hétköznapi fűszernövények – mint a menta, az eukaliptusz és a csilipaprika – természetes vegyületei elképesztő erővel léphetnek fel a szervezet gyulladásos folyamatai ellen, főleg, ha bizonyos kombinációkban találkoznak az immunrendszer sejtjeiben...
Érdekes felvetés, hogy néhány kulcsfontosságú, nyílt forráskódú program fejlesztői napok óta nem tudják frissíteni alkalmazásaikat Windowsra, mert a Microsoft egyik pillanatról a másikra, érdemi figyelmeztetés nélkül felfüggesztette a fejlesztői fiókjaikat...
A Case Western Reserve Egyetem kutatói egy meglepő összefüggésre derítettek fényt: a bélben élő baktériumok által termelt káros cukrok jelentős szerepet játszhatnak a rendkívül pusztító agyi betegségek, például az ALS (amiotrófiás laterálszklerózis) és a frontotemporális demencia kialakulásában...
A Galaxy S22 Ultra-tulajdonosok egy része teljesen váratlan akadályba ütközik, amikor a gyári beállítások visszaállítása után az általuk legálisan vásárolt telefont egyszer csak zárolják — ráadásul nem is ők, hanem egy ismeretlen, gyanús szervezet, a Numero LLC neve jelenik meg a készüléken...
A JBL két új modellje, a Live 780NC és a Live 680NC csábító ígérettel érkezett, hogy a középkategóriás vezeték nélküli, zajszűrős fejhallgatók élmezőnyébe törjön...
🚲 Egy újabb történelmi kört zárt a NASA, amikor az Orion űrhajó tizenhárom évnyi előkészület után négyfős személyzettel kerülte meg a Holdat és indult vissza a Föld felé...
📝 Komolyan mondom, végre egy kis ész a digitális káoszban! A Google beolvasztotta a NotebookLM nevű mesterségesintelligencia-alapú kutatósegédjét a Gemini csevegőjébe, így mostantól már nem kell ezer ablak között vergődve kezelni a jegyzeteidet...
Érdemes megvizsgálni, hogy a Meta legutóbbi MI-modellje, a Muse Spark képes-e új alapokra helyezni a cég mesterségesintelligencia-stratégiáját, miután a Llama 4 csalódást keltő fogadtatásban részesült...