OpenAI új eszközökkel készül az MI-ágensek munkaerőpiacra lépésére

OpenAI új eszközökkel készül az MI-ágensek munkaerőpiacra lépésére
Az MI-ipar minden tőle telhetőt megtesz, hogy valósággá váljanak az ágensek (esetleg ügynökök) – olyan MI-vezérelt szoftverek, amelyek több lépésből álló műveleteket hajthatnak végre a felhasználó nevében. Számos technológiai vállalat hangsúlyozta az ágens-jellegű funkciókat az utóbbi időben, és januárban Sam Altman, az OpenAI vezérigazgatója megemlítette, hogy 2025 lesz az az év, amikor az MI-ágensek csatlakoznak a munkaerőhöz. Az OpenAI azon dolgozik, hogy ezt az ígéretet valósággá változtassa. Kedden az OpenAI bemutatott egy új API-t, amelyet arra terveztek, hogy segítse a szoftverfejlesztőket olyan MI-ágensek létrehozásában, amelyek képesek önállóan feladatokat végrehajtani a vállalat MI-modelljeit használva. A Responses API végül leváltja a jelenlegi API-t, amelyet az OpenAI 2026 első felében tervez nyugdíjazni.

MI-ágensek a munkahelyi folyamatokban

Az új ajánlattal a felhasználók olyan egyedi MI-ágenseket fejleszthetnek, amelyek integrálódnak egy fájlkereső segédprogrammal, amely gyorsan ellenőrzi a vállalati adatbázisokat (az OpenAI ígérete szerint anélkül, hogy ezeken a fájlokon tanítaná modelljeit), és végrehajthatnak a GPT-4-en keresztül elérhető funkciókhoz hasonló feladatokat. A fejlesztők hozzáférhetnek a háttérben működő Computer-Using Agent (CUA) modellhez is, amely lehetővé teszi olyan feladatok automatizálását, mint az adatbevitel és egyéb műveletek.

A Responses API-t használó fejlesztők hozzáférhetnek ugyanazokhoz a modellekhez, amelyek a GPT-4o keresést és a GPT-4o mini keresést működtetik. Ezek a modellek képesek kérdésekre válaszolni és forrásokat idézni válaszaikban.

Pontosabb keresési eredmények

Ez azért figyelemreméltó, mert az OpenAI szerint a hozzáadott webes keresési képesség drámaian javítja MI-modelljeinek ténybeli pontosságát. Az OpenAI tesztelési oldalán, amely a konfabulációs arányt hivatott mérni, a GPT-4o kereső 90 százalékot ért el, míg a GPT-4o mini kereső 88 százalékot – mindkettő lényegesen felülmúlta a nagyobb, keresés nélküli GPT-4.5 modellt, amely 63 százalékot ért el.

Ezen fejlesztések ellenére a technológiának még mindig jelentős korlátai vannak. A CUA webhelyek megfelelő navigálásával kapcsolatos problémáin túl a javított keresési képesség nem oldja meg teljesen az MI konfabulációk (halluzás) problémáját, a GPT-4o kereső még mindig 10 százalékban követ el ténybeli hibákat.

Nyílt forráskódú eszközkészlet fejlesztőknek

A Responses API mellett az OpenAI kiadta a nyílt forráskódú eszközkészletet is, amely ingyenes eszközöket biztosít a fejlesztőknek a modellek belső rendszerekkel való integrálásához, biztonsági óvintézkedések megvalósításához és az ágensek tevékenységének figyelemmel kíséréséhez. Ez az eszközkészlet az OpenAI korábbi, több ágens egyidejű kezelésére szolgáló keretrendszerének kiadását követi.

Még mindig a korai szakaszában járunk az MI-ágensek területén, és a dolgok valószínűleg gyorsan fognak fejlődni. Azonban jelenleg az MI-ágens mozgalom továbbra is ki van téve a valószerűtlen állításoknak, amint azt a héten egy kínai startup ágens platformja is bizonyította, amely nem tudta teljesíteni ígéretei nagy részét, kiemelve a promóciós állítások és a gyakorlati funkcionalitás közötti tartós szakadékot ebben a kialakulóban lévő technológiai kategóriában.

  • Te mit gondolsz arról, hogy az MI-ágensek a jövőben fontosabb szerepet tölthetnek be a munkahelyi folyamatokban?
  • Te mit tennél, ha egy MI-ágens téves információkat szolgáltatna, és ez negatív hatással lenne a projektre?


Legfrissebb posztok

MA 17:17

Az új Volvo EX60 644 km-t megy, és villámgyorsan tölt

🚗 A hónap végén mutatkozik be a Volvo legújabb elektromos SUV-je, az EX60, amely több úttörő megoldást hoz a villanyautók világába...

MA 17:03

Az MI-modellek egyre inkább ugyanúgy látják a világot

👁 Érdemes megvizsgálni, miként érzékeli és dolgozza fel a valóságot az MI az emberi agyhoz hasonlóan...

MA 16:49

Az Exchange Online megint döcög: leáll az IMAP4-es levelezés

📦 A Microsoft újabb leállással küzd az Exchange Online-ban, amely miatt sok felhasználó nem tudja elérni postafiókját IMAP4-en keresztül...

MA 16:34

Visszatér az egyensúly az ingatlanpiacra – de meddig?

🏡 Az utóbbi negyedévben az amerikai ingatlanpiac lassú, de jelentős átalakuláson megy keresztül: a vásárlók és eladók közötti erőviszonyok kiegyenlítődnek...

MA 16:18

A pénztárcabarát okosizzók párbaja: Lifx vagy Philips Hue Essential?

💡 A CES kiállításon idén is a legnagyobb techcégek legújabb termékei kaptak főszerepet...

MA 16:02

Az új Gmail mindent tud: MI-válaszok, nyelvi ellenőrzés – nem ingyen

📧 A Gmail mostantól olyan okosan válaszolja meg a leveleidben feltett kérdéseidet, mint egy Google-keresés – csak épp MI-vel és fizetős verzióban...

MA 15:49

A mesterséges intelligencia veszi át az irányítást a JPMorgannál

A JPMorgan Chase vagyonkezelő részlege, amely több mint 7 billió dollár (more than $7 trillion) értékű ügyfélvagyont kezel, váratlanul megszakította az együttműködést a proxy-tanácsadó cégekkel...

MA 15:33

Az új Gmail tényleg mindent elintéz helyettünk?

A Gmail hamarosan jelentős átalakuláson megy keresztül, hiszen még több, Gemini-alapú MI-funkcióval bővül...

MA 15:18

Az ősi afrikai méregnyilak hátborzongató titka – mi az igazság?

Hatvanezer éves, méregbe mártott nyílhegyek kerültek elő Dél-Afrikában, ezzel pedig minden korábbinál régebbi bizonyítékot találtak a mérgezett fegyverek használatára...

MA 14:50

A Samsung új kihajtható OLED-je tarol – de kié lesz először?

🚀 A helyzet drámaian alakult a 2026-os CES-en, amikor a Samsung bemutatta a résmentes zsanérral és gyűrődésmentes, teljesen sima OLED-kijelzőjével szerelt prototípusát...

MA 14:33

Az agy titkos fegyvere: így lesz gyerekjáték a mozgás

Miért van az, hogy egy rövid futás után egyesek már lihegnek, míg mások szinte lebegnek a pályán?..

MA 13:50

A 10 perces edzés, amely már a rákos sejteket is megriaszthat

💪 Újév táján sokan vágnak bele edzésbe, pedig elegendő lehet napi 10 perc intenzív mozgás ahhoz, hogy jelentősen csökkentse a rák kialakulásának kockázatát...

MA 13:18

A grönlandi jégpajzs már egyszer eltűnt – megtörténhet megint?

A Grönland északnyugati részén fekvő Prudhoe Dome, ez az ötszáz méter vastag jégkupola, körülbelül hétezer évvel ezelőtt teljesen elolvadt, amikor a nyári hőmérséklet 3–6 Celsius-fokkal meghaladta a mainál mérteket – hasonló értékeket jósolnak 2100-ra is...

MA 12:34

Az űrállomásról rajtolhat az első űrbéli orvosi mentés

Az amerikai űrügynökség minden eddiginél komolyabb orvosi vészhelyzet elé nézhet: az egyik űrhajós a Nemzetközi Űrállomáson (ISS) váratlanul egészségügyi problémákat tapasztalt, ezért egy előre tervezett űrsétát elhalasztottak, és felmerült, hogy a legénység egy részét előbb kell hazahozni, mint ahogy eredetileg tervezték...

MA 12:02

Vége az álomnak: a Ballie sosem költözik be otthonainkba?

😪 Hat év fejlesztés és ígérgetés után a Samsung Ballie nevű otthoni robotja végleg eltűnt a vásárlók elől, és már csak belső céges projektté silányult...

MA 11:49

Az ifjú galaxisfürt, amely megrengeti a kozmológiai elméleteket

Különösen figyelemre méltó, hogy egy nemzetközi kutatócsoport olyan galaxisfürtöt azonosított, amely a feltételezettnél jóval korábban és jóval magasabb hőmérsékleten jelent meg az univerzumban, mint amit a mai elméletek megengednének...

MA 10:58

A meglepő ok, amiért jéghidegnek érezzük a vizet mentolos fogkrém után

👀 Külön említést érdemel, hogy sokan ismerik a pillanatot, amikor fogmosás után iszunk egy korty vizet, és az hirtelen jéghidegnek tűnik, sőt, a levegővétel is hűsítő élményt nyújt...

MA 10:50

A rendszeres mozgás felérhet a terápiával depresszió ellen

Világszerte több mint 280 millió embert érint a depresszió, amely komoly terhet ró az egészségügyre és az érintettekre...

MA 10:43

A Chase veszi át az Apple hitelkártyáját – jön a váltás

Az Apple Card felhasználók egyelőre nem fognak változást érzékelni, miután az Apple hivatalosan bejelentette, hogy a JPMorgan Chase váltja a Goldman Sachsot a hitelkártya-kibocsátójaként...