OpenAI új eszközökkel készül az MI-ágensek munkaerőpiacra lépésére
Az MI-ipar minden tőle telhetőt megtesz, hogy valósággá váljanak az ágensek (esetleg ügynökök) – olyan MI-vezérelt szoftverek, amelyek több lépésből álló műveleteket hajthatnak végre a felhasználó nevében. Számos technológiai vállalat hangsúlyozta az ágens-jellegű funkciókat az utóbbi időben, és januárban Sam Altman, az OpenAI vezérigazgatója megemlítette, hogy 2025 lesz az az év, amikor az MI-ágensek csatlakoznak a munkaerőhöz.
Az OpenAI azon dolgozik, hogy ezt az ígéretet valósággá változtassa. Kedden az OpenAI bemutatott egy új API-t, amelyet arra terveztek, hogy segítse a szoftverfejlesztőket olyan MI-ágensek létrehozásában, amelyek képesek önállóan feladatokat végrehajtani a vállalat MI-modelljeit használva. A Responses API végül leváltja a jelenlegi API-t, amelyet az OpenAI 2026 első felében tervez nyugdíjazni.
MI-ágensek a munkahelyi folyamatokban
Az új ajánlattal a felhasználók olyan egyedi MI-ágenseket fejleszthetnek, amelyek integrálódnak egy fájlkereső segédprogrammal, amely gyorsan ellenőrzi a vállalati adatbázisokat (az OpenAI ígérete szerint anélkül, hogy ezeken a fájlokon tanítaná modelljeit), és végrehajthatnak a GPT-4-en keresztül elérhető funkciókhoz hasonló feladatokat. A fejlesztők hozzáférhetnek a háttérben működő Computer-Using Agent (CUA) modellhez is, amely lehetővé teszi olyan feladatok automatizálását, mint az adatbevitel és egyéb műveletek.
A Responses API-t használó fejlesztők hozzáférhetnek ugyanazokhoz a modellekhez, amelyek a GPT-4o keresést és a GPT-4o mini keresést működtetik. Ezek a modellek képesek kérdésekre válaszolni és forrásokat idézni válaszaikban.
Pontosabb keresési eredmények
Ez azért figyelemreméltó, mert az OpenAI szerint a hozzáadott webes keresési képesség drámaian javítja MI-modelljeinek ténybeli pontosságát. Az OpenAI tesztelési oldalán, amely a konfabulációs arányt hivatott mérni, a GPT-4o kereső 90 százalékot ért el, míg a GPT-4o mini kereső 88 százalékot – mindkettő lényegesen felülmúlta a nagyobb, keresés nélküli GPT-4.5 modellt, amely 63 százalékot ért el.
Ezen fejlesztések ellenére a technológiának még mindig jelentős korlátai vannak. A CUA webhelyek megfelelő navigálásával kapcsolatos problémáin túl a javított keresési képesség nem oldja meg teljesen az MI konfabulációk (halluzás) problémáját, a GPT-4o kereső még mindig 10 százalékban követ el ténybeli hibákat.
A Responses API mellett az OpenAI kiadta a nyílt forráskódú eszközkészletet is, amely ingyenes eszközöket biztosít a fejlesztőknek a modellek belső rendszerekkel való integrálásához, biztonsági óvintézkedések megvalósításához és az ágensek tevékenységének figyelemmel kíséréséhez. Ez az eszközkészlet az OpenAI korábbi, több ágens egyidejű kezelésére szolgáló keretrendszerének kiadását követi.
Még mindig a korai szakaszában járunk az MI-ágensek területén, és a dolgok valószínűleg gyorsan fognak fejlődni. Azonban jelenleg az MI-ágens mozgalom továbbra is ki van téve a valószerűtlen állításoknak, amint azt a héten egy kínai startup ágens platformja is bizonyította, amely nem tudta teljesíteni ígéretei nagy részét, kiemelve a promóciós állítások és a gyakorlati funkcionalitás közötti tartós szakadékot ebben a kialakulóban lévő technológiai kategóriában.
filózó
Te mit gondolsz arról, hogy az MI-ágensek a jövőben fontosabb szerepet tölthetnek be a munkahelyi folyamatokban?
Te mit tennél, ha egy MI-ágens téves információkat szolgáltatna, és ez negatív hatással lenne a projektre?
Jövő hónapban tizenkét fős csapat indul Norvégia sarkköri kisvárosába, Kirkenesbe, hogy megkezdje elképesztő utazását a Föld egyik legkietlenebb, legzordabb vidékére...
💻 Az Nvidia friss partnerségi programja forradalmasítja a startupok és a csipgyártó kapcsolatát: a gyorsan bővülő MI-cégekkel mostantól olyan megállapodásokat köt, amelyekben jövőbeli bevételük egy részéért cserébe számítási kapacitást biztosít...
Egy átlagos téli napon meglehetősen szokatlan, amikor két vadidegen fiatalember jelentkezik egy irodaház karbantartóinál azzal, hogy szívesen segítenének havat lapátolni – főleg úgy, hogy az őrszoba ajtaja nyitva van, a személyzet épp el van foglalva, és senki sem figyeli igazán, kinek van keresnivalója az épületben...
🍔 Egy lényeges szempont, hogy az éttermek számára elérhetővé vált egy radikálisan új lehetőség: mostantól közvetlenül ChatGPT-n és Claude-on keresztül lehet ételt rendelni, köszönhetően a Square friss, egyszerű és alacsony díjas integrációjának...
☁ A Nap időszakonként egyre hevesebb viharokat küld felénk, amelyek páratlan fényjelenségeket okoznak az égbolton, ám a látványos északi fény mögött csendben megbújik egy sokkal fenyegetőbb veszély is...
Az Ethereum körüli világ sosem volt még ilyen pezsgő. A legújabb, nagy horderejű esemény az Ethereum Institutional elindulása, amely a blokklánc-ökoszisztémát új szintre kívánja emelni a pénzügyi szereplők bevonása és az eszközök tokenizálása terén...
🌕 A világegyetem néha egészen hihetetlen történeteket produkál. 2020-ban csillagászok felfedeztek egy WD 1856b nevű gázóriás bolygót, amely egy fehér törpe – egy Naphoz hasonló csillag kihűlt magja – körül kering...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Risp: Budget & Savings (iPhone/iPad)A Risp egy alkalmazás, amely segít a pénzügyeid kezelésében...
🚀 A NASA vezetője, Jared Isaacman optimistán nyilatkozott a Blue Origin közelmúltbeli fejleményeiről, miután a május végi rakétabaleset alapos rendrakást követelt a cégtől Cape Canaveralben...
Az Anthropic hónapokkal ezelőtt rejtett kódrészleteket helyezett el a Claude Code rendszerében, hogy felismerje, ha más MI-fejlesztő cégek, főleg Kínából, le akarnák másolni a modelljeit...
💡 Az elmúlt napokban rengeteg Google Home-tulajdonos tapasztalta, hogy okos hangszórója vagy kijelzős eszköze jóval lassabban reagál a megszokottnál, sőt, előfordult, hogy egyáltalán nem válaszolt...
Bár a Samsung hivatalosan még nem mutatta be a Galaxy Z Fold 8-at, néhány megbízható szivárogtatásnak hála már most látni lehet a hajlítható telefon új külsejét...
Külön említést érdemel, hogy az Apple E-mail-cím elrejtése (Hide My Email) szolgáltatásában súlyos sebezhetőségre derült fény, amely lehetővé teszi, hogy gyakorlatilag bárki megszerezze a felhasználók valódi e-mail-címét – még akkor is, ha az az Apple rendszerében elvileg rejtve van...
🚀 Tipikus eset, amikor a laboratóriumi kísérletek nem csupán elméleti kérdéseket feszegetnek, hanem kézzelfogható áttörésekkel tolják ki a biotechnológia határait...
Válságok, trónharcok és történelmi fordulópontok: ezen a napon császárok emelkedtek hatalomra, forradalmi találmányok születtek, és sorsfordító háborúk kaptak szikrát...
⚠ Továbbá megemlíthető, hogy a bitcoin-bányászat energiapazarlása elképesztő mértéket ölt: a hálózati késleltetés okozta felesleges energiafelhasználás nagyjából 16 000 megawattnyi teljesítményt jelent, ami megegyezik Svájc 701 vízerőművének teljes termelési kapacitásával...
Ha valaki több mint egy évtizede játszott a Rhythm Heavennel, valószínűleg sosem felejtette el azt a különös, szürreális világot, ahol dadogó pankrátorok és furcsa madarak ugrálnak egy lélekmelengető popdallamra...
A brit távközlési piac gigantikus átalakulása zajlik: az ország versenyhatósága kiemelt vizsgálatot indított annak kapcsán, hogy a Netomnia anyavállalatát, a Substantialt a Liberty Global, a Telefonica és az InfraVia konzorciuma felvásárolja...