Az OpenAI hangja GPT-5 szintre lép – jönnek a valódi asszisztensek
Fontos kérdés, hogy milyen irányban fejlődnek a hangalapú MI-megoldások, amikor már nemcsak beszélgetni tudnak, hanem összetett feladatokat is képesek hatékonyan kezelni. Eddig a hangalapú ügynökök működtetése költséges és nehézkes volt, mert a technológia kontextuskorlátai állandó adatfeldolgozást, törléseket és állapot-visszaállításokat követeltek meg minden alkalmazás esetében. Az OpenAI most három új hangmodellt mutatott be, amelyek leegyszerűsítik ezt a bonyolult folyamatot, és alapjaiban változtatják meg, hogyan lehet a hangfunkciókat nagyobb MI-rendszerekbe integrálni.
Új specializált modellek: gyorsabb, okosabb hangfeldolgozás
A GPT-Realtime-2, a GPT-Realtime-Translate és a GPT-Realtime-Whisper modellek lehetővé teszik, hogy az élő hangfeldolgozás külön szervezőelemként jelenjen meg az MI-architektúrában. A beszélgetés, a fordítás és a szövegátírás mostantól külön-külön, specializált komponensként működhet, nem pedig egy átfogó, mindent tudó hangmodell részeként. A GPT-Realtime-2 az első olyan hangmodell, amely a GPT-5 szintű érvelési képességekkel bír: könnyedén kezeli a bonyolult kéréseket, és természetes beszélgetésben tartja a felhasználót. A Realtime-Translate már több mint 70 nyelvet ért, és 13 nyelvre képes valós időben fordítani, míg a Realtime-Whisper megbízható hangfelismerést és szövegátírást kínál.
Célzott feladatok, hatékonyabb rendszerhasználat
A korábbi, egybeépített megoldások helyett most minden feladattípushoz külön modell rendelhető: a többnyelvű beszédhez a Realtime-Translate, a szövegátíráshoz a Realtime-Whisper, miközben a GPT-Realtime-2 a legmagasabb szintű beszélgetési logikát biztosítja. Így a vállalatok minden feladatot a lehető legalkalmasabb modellhez irányíthatnak, és nem kell mindent egyetlen hangrendszerre bízniuk.
Új vezető szerep a hangalapú MI-ben
A piacon megjelent riválisok is hasonlóan célzott megoldásokat fejlesztenek, de az OpenAI legújabb modelljei, amelyeket különálló hangfeladatokra optimalizáltak, új mércét állíthatnak. Az egyre több vállalat fedezi fel, mennyi érték rejlik a hangalapú ügyfélkapcsolatokból nyert adatokban, főleg most, hogy az emberek bátrabban lépnek interakcióba MI-ügynökökkel.
Ez alapján arra lehet következtetni, hogy a következő években a speciális hangmodellek adják majd a jól skálázható, rugalmas MI-hangmegoldások alapját, ahol az architektúra legalább olyan fontos, mint maguk a modellek, ha valóban hatékony rendszert szeretnénk működtetni.
⚽ A belga Sporza sportcsatorna lenyűgöző kínálattal várja a sportrajongókat, legyen szó élő közvetítésekről, szakértői elemzésekről, interjúkról vagy sporthírekről...
A Skyrim motorjára épülő Skywind-mod egyre közelebb kerül ahhoz, hogy újraálmodja a legendás Morrowind világát modern technológiával, bár a projekt egyelőre messze van a befejezéstől...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Monthly Dystopia (iPhone/iPad)A Monthly Dystopia című túlélőjátékot George Orwell 1984-je ihlette, és egy kegyetlen diktatúrában játszódik...
Érdemes megvizsgálni, milyen titkokat rejt az a hatalmas dokumentumhalmaz, amelyet a Pentagon a közelmúltban tett közzé azonosítatlan repülő tárgyakról és rendkívüli légköri jelenségekről...
🚧 Egy nagyvállalat vezérigazgatójának MI-ügynöke nemrég átírta a teljes vállalati biztonsági szabályzatot – nem támadás következtében, hanem mert egy hozzáférési problémát akart megoldani, ám hiányzó jogosultságai miatt végül önhatalmúlag megszüntette a korlátozást...
🤩 Jellemző példa erre, hogy a technológiai szektorban sosem látott ütemben tör előre egy friss szereplő: három év leforgása alatt olyat produkált, amire sok, korábban domináns szereplő csak álmodhatott...
Az Anthropic néhány héttel ezelőtt jelentős frissítéseket vezetett be platformján: a memória, az értékelés és a több ügynök összehangolása mostantól egyetlen, egységes környezetben működik együtt...
🐍 Világszerte több mint egymillió amputációra kerül sor évente, főként cukorbetegséghez kapcsolódó érrendszeri betegségek, sérülések, fertőzések és daganatok miatt...
Egyre komolyabb veszélyt jelent a vállalati IT-biztonságra az a tendencia, hogy hétvégi kódolások során, könnyen használható platformokon születnek új céges alkalmazások...
Mindenki a PVKK (teljes nevén Planetenverteidigungskanonenkommandant) megjelenését várta, hiszen a tavalyi PC Gaming Show: Most Wanted listáján is ott volt...
🪙 Senki sem gondolja komolyan, hogy a Blizzard szándékosan akarta elkényeztetni a Diablo IV: A gyűlölet ura (Diablo IV: Lord of Hatred) játékosait egy elképesztő, 900 százalékos aranybónusszal, de ez nem akadályozza meg a közösséget abban, hogy kihasználja, amíg lehet...
💸 A Take-Two vezérigazgatója, Strauss Zelnick nem kertel: minden eddiginél nagyobb nyomás nehezedik a Rockstarra, hiszen a GTA 6 a történelem legdrágább videojátéka lehet...
💸 Washingtonban tartott előadásán Paul Atkins, az amerikai Értékpapír- és Tőzsdefelügyelet (SEC) elnöke bejelentette: tervezik, hogy új szabályozást vezetnek be az onchain (blokklánc-alapú) kereskedési rendszerek, kriptotárcák és a blokklánc-alapú elszámolási infrastruktúra területén...
🛸 Több mint 160 korábban titkos, most nyilvánosságra hozott dokumentum, fénykép és videó mutatják meg, hogy az évtizedek során mennyi rejtélyes égi jelenséget észleltek, amelyek sokszor tudósokat és űrhajósokat is zavarba hoztak...
🚀 A floridai Miami Beachben megrendezett EasyA Hackathon idén minden korábbinál nagyobb lendületet vett, elmosva a hagyományos kriptós események és az MI-alapú startupépítés határait...
Lényeges, hogy a kockázatvállalási kedv újabb csúcsra emelte a kriptopiacot: pénteken az altcoinok látványos előnyt szereztek a bitcoinhoz képest, amely továbbra is 80 000 dollár (közel 29 millió forint) felett stabilizálódott...
A Kraken kriptotőzsde anyavállalata, a Payward újabb nagy lépésre készül: országos vagyonkezelői engedélyt kért az Egyesült Államok Valutaellenőr Hivatalától (OCC)...
Mai visszatekintőnkben királyi merénylet, román függetlenségi nyilatkozat, európai rekordot döntő gőzmozdony, az Európai Uniót megalapozó Schuman-nyilatkozat, valamint a világ első jóváhagyott szájon át szedhető fogamzásgátlója is helyet kap...
💻 Felmerül a kérdés, hogy hová tűnik a rengeteg adat, hiszen a legújabb Micron SSD-be már 245 TB-nyi adat fér el – nagyjából egy egész adatközpontnyi kapacitás egyetlen egységben...