
Olcsóbb és gyorsabb hang-MI
Megérkezett a gpt-realtime mini, az OpenAI új hangmodellje, amely az API-ban érhető el. Az előzőeknél 70%-kal olcsóbb, de ugyanazt a minőséget és kifejezőkészséget nyújtja, ráadásul gyakorlatilag valós idejű hangalapú interakciót tesz lehetővé. Ez nagy előrelépés, mivel a beszédalapú vezérlések egyre fontosabbak a mindennapi MI-használatban.
A Sora 2 óriási ugrás a MI-videókban
Az OpenAI Sora 2-je, a legújabb hang- és képalkotó MI, már elérhető a fejlesztők számára az API-n keresztül. A Sora alkalmazással bárki készíthet rövid, MI által generált videókat magáról, ismerőseiről vagy bármilyen ötletéről, majd ezeket egy TikTok-szerű felületen azonnal meg is oszthatja. Az új generáció realisztikusabb látványt, koherensebb hangképet és sokkal nagyobb kreatív szabadságot kínál: például egy iPhone-nal rögzített szűk képkivágást a Sora 2 mozi-hatású, széles látószögű videóvá tud bővíteni, miközben a hangokat is precízen szinkronizálja a vizuális effektekkel. Ez új távlatokat nyit a reklámkoncepciók vagy akár a játéktervezés területén, hiszen egy ötletből pillanatok alatt látványos vizuális terveket lehet varázsolni.