OpenAI új eszközökkel készül az MI-ágensek munkaerőpiacra lépésére
Az MI-ipar minden tőle telhetőt megtesz, hogy valósággá váljanak az ágensek (esetleg ügynökök) – olyan MI-vezérelt szoftverek, amelyek több lépésből álló műveleteket hajthatnak végre a felhasználó nevében. Számos technológiai vállalat hangsúlyozta az ágens-jellegű funkciókat az utóbbi időben, és januárban Sam Altman, az OpenAI vezérigazgatója megemlítette, hogy 2025 lesz az az év, amikor az MI-ágensek csatlakoznak a munkaerőhöz.
Az OpenAI azon dolgozik, hogy ezt az ígéretet valósággá változtassa. Kedden az OpenAI bemutatott egy új API-t, amelyet arra terveztek, hogy segítse a szoftverfejlesztőket olyan MI-ágensek létrehozásában, amelyek képesek önállóan feladatokat végrehajtani a vállalat MI-modelljeit használva. A Responses API végül leváltja a jelenlegi API-t, amelyet az OpenAI 2026 első felében tervez nyugdíjazni.
MI-ágensek a munkahelyi folyamatokban
Az új ajánlattal a felhasználók olyan egyedi MI-ágenseket fejleszthetnek, amelyek integrálódnak egy fájlkereső segédprogrammal, amely gyorsan ellenőrzi a vállalati adatbázisokat (az OpenAI ígérete szerint anélkül, hogy ezeken a fájlokon tanítaná modelljeit), és végrehajthatnak a GPT-4-en keresztül elérhető funkciókhoz hasonló feladatokat. A fejlesztők hozzáférhetnek a háttérben működő Computer-Using Agent (CUA) modellhez is, amely lehetővé teszi olyan feladatok automatizálását, mint az adatbevitel és egyéb műveletek.
A Responses API-t használó fejlesztők hozzáférhetnek ugyanazokhoz a modellekhez, amelyek a GPT-4o keresést és a GPT-4o mini keresést működtetik. Ezek a modellek képesek kérdésekre válaszolni és forrásokat idézni válaszaikban.
Pontosabb keresési eredmények
Ez azért figyelemreméltó, mert az OpenAI szerint a hozzáadott webes keresési képesség drámaian javítja MI-modelljeinek ténybeli pontosságát. Az OpenAI tesztelési oldalán, amely a konfabulációs arányt hivatott mérni, a GPT-4o kereső 90 százalékot ért el, míg a GPT-4o mini kereső 88 százalékot – mindkettő lényegesen felülmúlta a nagyobb, keresés nélküli GPT-4.5 modellt, amely 63 százalékot ért el.
Ezen fejlesztések ellenére a technológiának még mindig jelentős korlátai vannak. A CUA webhelyek megfelelő navigálásával kapcsolatos problémáin túl a javított keresési képesség nem oldja meg teljesen az MI konfabulációk (halluzás) problémáját, a GPT-4o kereső még mindig 10 százalékban követ el ténybeli hibákat.
A Responses API mellett az OpenAI kiadta a nyílt forráskódú eszközkészletet is, amely ingyenes eszközöket biztosít a fejlesztőknek a modellek belső rendszerekkel való integrálásához, biztonsági óvintézkedések megvalósításához és az ágensek tevékenységének figyelemmel kíséréséhez. Ez az eszközkészlet az OpenAI korábbi, több ágens egyidejű kezelésére szolgáló keretrendszerének kiadását követi.
Még mindig a korai szakaszában járunk az MI-ágensek területén, és a dolgok valószínűleg gyorsan fognak fejlődni. Azonban jelenleg az MI-ágens mozgalom továbbra is ki van téve a valószerűtlen állításoknak, amint azt a héten egy kínai startup ágens platformja is bizonyította, amely nem tudta teljesíteni ígéretei nagy részét, kiemelve a promóciós állítások és a gyakorlati funkcionalitás közötti tartós szakadékot ebben a kialakulóban lévő technológiai kategóriában.
filózó
Te mit gondolsz arról, hogy az MI-ágensek a jövőben fontosabb szerepet tölthetnek be a munkahelyi folyamatokban?
Te mit tennél, ha egy MI-ágens téves információkat szolgáltatna, és ez negatív hatással lenne a projektre?
A több mint 3000 éttermet működtető Jersey Mike’s a nyilvános tőzsdei kibocsátásra (IPO) készül: a cég titokban beadta a szükséges papírokat, így megkezdődött az a folyamat, amelynek eredményeként részvényeivel nyilvánosan is lehet kereskedni...
Egy hétfő délutáni zuhanórepülés: az AST SpaceMobile részvényei 9%-kal estek vissza, miután kiderült, hogy a cég vadonatúj BlueBird 7 műholdját a Blue Origin rakétája rossz helyre parkolta...
🖌 A játékosok már nemcsak álmodozhatnak a saját menő tárgyaikról vagy dekorációikról Tomodachi Life-ban: mostantól egy rajongói fejlesztésű weboldal, a Living the Grid mindenki számára lehetővé teszi, hogy bármilyen képből tökéletes pixel artot készítsen a játékban felhasználható formában...
Ilyen eset például, amikor valaki a terhessége alatt nemcsak gyakori hányingert és émelygést tapasztal, hanem extrém rosszullétek gyötrik, amelyek miatt még enni vagy inni sem tud, sőt, akár kórházi kezelésre is szorul...
Különösen igaz ez akkor, ha a videojáték-ipar legmeghatározóbb vállalatainak vezetői beszélnek az új technológiákról: az MI (mesterséges intelligencia) helyzete ugyanis sokakat megoszt...
⚡ Elég menő, amikor valaki otthon összedob egy saját „nukleáris elemet”. Az egész egyáltalán nem boszorkányság: egy kis ügyeskedéssel a radioaktív tritium fénycsövei simán társíthatók hétköznapi amorf napelemekkel...
A jogászi pálya legendásan technofób: a faburkolatos tárgyalótermek, vaskos törvénykönyvek és hosszú latin kifejezések világában a legtöbben még mindig írásos jegyzetekre támaszkodnak, miközben más szakmák már régen mobilalkalmazásokra, chatbotokra és algoritmusokra bízzák a mindennapi rutint...
⚡ Felmerül a kérdés, hogy egy brit gázbefektető cég, a Reabold Resources miért próbálkozik bitcoin-bányászattal az ország egyik legnagyobb gázmezején...
💡 A milánói dizájnhéten egy eddig nem látott, kör alakú kijelző köszönti a látogatókat a Samsung standján, amelynek forgatható “feje” első pillantásra a Luxo Jr...
A következő generációs, kijelző nélküli Fitbit aktivitásmérő körül egyre több pletyka kering, miután Steph Curry Instagramon is megvillantotta az eszközt...
Ma már könnyű észrevétlenül belezuhanni a végtelen görgetés csapdájába: egy gyors üzenetellenőrzés vagy néhány percnyi szünet a munkahelyen pillanatok alatt órává nyúlhat...
A Google Pixel telefonok régóta rendelkeznek egyes, csak erre a szériára jellemző funkciókkal, de akad közöttük olyan is, amely még a rajongók széles táborában is ismeretlen maradt...
💸 Megemlíthető, hogy a kriptopiac most igencsak izgalmas időszakát éli. Az amerikai spot bitcoin ETF-ek pénteken 244 milliárd forintnyi (663 millió USD) friss tőkét szívtak fel, ami január közepe óta a legmagasabb napi érték...
🧠 Két évszázad után először sikerült a tudósoknak laboratóriumi körülmények között dolomitot növeszteniük, átfogó választ adva a geológia egyik legrégebbi rejtélyére...
Fontos kérdés, miként okozhat ekkora károkat egyetlen rossz biztonsági döntés. Egy 106 milliárd forint (290 millió USD) értékű támadás rázta meg a decentralizált pénzügyi szektort, amikor a Kelp DAO jóvátehetetlen károkat szenvedett – és mindez nem protokollhibán, hanem a rosszul beállított védelem miatt történt...
💡 Az elmúlt néhány évben óriásit ugrott a vörösfény-terápiás eszközök piaca: 2024-ben 158 milliárd forintot tett ki, 2025-re várhatóan 167 milliárd lesz, és 2032-re elérheti a 248 milliárdot is...
🚀 Senki sem várta volna, hogy a Blue Origin első kereskedelmi küldetése ilyen felemásan alakul: miközben a New Glenn rakéta újrahasznosított első fokozata tökéletesen leszállt a visszatérő hajóra, a fő feladat – a kommunikációs műhold pályára állítása – kudarcba fulladt...