Az MI-csata folytatódik: az OpenAI új képgeneráló funkciót dobott piacra
Egy keddi élő közvetítés során az OpenAI vezérigazgatója, Sam Altman bejelentette az első jelentős frissítést a képgenerálási képességek terén több mint egy év után. A ChatGPT mostantól képes a vállalat modelljét felhasználva natív módon létrehozni és módosítani képeket és fotókat. A GPT-4o régóta az MI-alapú csevegőrobot-platform alapja, de eddig a modell kizárólag szöveg generálására és szerkesztésére volt képes – képek előállítására nem.
Altman elmondta, hogy a GPT-4o natív képgenerálási funkciója már ma elérhető a ChatGPT-ben és a Sorában, az OpenAI MI-videógeneráló termékében, a vállalat havi 200 dolláros (kb. 71 ezer forintos) Pro előfizetői számára. Az OpenAI szerint a funkció hamarosan elérhetővé válik a Plus és ingyenes ChatGPT felhasználók, valamint a vállalat API-szolgáltatását használó fejlesztők számára is.
Pontosabb, részletesebb képek
A képkimenettel rendelkező GPT-4o “gondolkodik” egy kicsit tovább, mint az a képgenerálási modell, amelyet hatékonyan helyettesít, hogy – az OpenAI leírása szerint – pontosabb és részletesebb képeket készítsen. A GPT-4o képes meglévő képek szerkesztésére, beleértve az embereket ábrázoló képeket is, átalakítva azokat vagy “befestve” olyan részleteket, mint az előtérben vagy háttérben lévő tárgyak.
Az új képfunkció működtetéséhez az OpenAI elmondta, hogy a GPT-4o-t “nyilvánosan elérhető adatokon”, valamint a vállalatnak a Shutterstockhoz hasonló cégekkel kötött partnerségeiből származó saját adatokon képezték ki.
Jogi kérdések
Sok generatív MI-szolgáltató versenyképes előnynek tekinti a tréningadatokat, ezért ezeket és a kapcsolódó információkat titokban tartják. Az adatokkal kapcsolatos részletek azonban potenciális szellemi tulajdoni perek forrásai is lehetnek, ami szintén visszatarthatja a vállalatokat attól, hogy túl sokat hozzanak nyilvánosságra.
“Tiszteletben tartjuk a művészek jogait abban, ahogy a kimenetet kezeljük, és vannak olyan szabályaink, amelyek megakadályozzák, hogy bármely élő művész munkáját közvetlenül utánzó képeket generáljunk” – mondta Brad Lightcap, az OpenAI operatív igazgatója.
Az OpenAI kínál egy leiratkozási űrlapot, amely lehetővé teszi az alkotók számára, hogy kérjék műveik eltávolítását a tréningadatkészleteiből. A vállalat azt is állítja, hogy tiszteletben tartja azokat a kéréseket, amelyek megtiltják webes szkennelő botjainak, hogy tréningadatokat – többek között képeket – gyűjtsenek a webhelyekről.
🚀 A japán Advantest részvényei akár 14%-ot is emelkedtek csütörtökön, miután a vállalat minden eddiginél nagyobb negyedéves árbevételt jelentett, köszönhetően az MI-chipek tesztelőberendezései iránti robbanásszerű keresletnek...
December végén összehangolt kibertámadás érte Lengyelország áramhálózatát, amely mintegy 30 különböző elosztott energetikai létesítményt célzott, köztük kapcsolt hő- és áramtermelő erőműveket, valamint szél- és napenergia-rendszereket...
🤖 A Tesla először veszteséggel zárta az évet az elektromosautó-piacon: a bevételek 3%-kal csökkentek 2025-ben, miközben a vállalat profitja az utolsó negyedévben 61%-kal esett vissza...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. TimesX Times Tables Tester (iPhone/iPad)A TimesX egy olyan alkalmazás, amely segít az általános iskolás gyerekeknek a szorzótábla gyakorlásában...
2026-ban éppen száz éve lesz annak, hogy Erwin Schrödinger megalkotta azt az egyenletet, amely alapjaiban változtatta meg a fizikáról alkotott képünket...
A Samsung hivatalosan megerősítette, hogy még idén bemutatja következő generációs AR-szemüvegét, amely multimodális MI-képességekkel lesz felszerelve...
📶 Ilyen eset például, amikor Joseph Fourier kétszáz évvel ezelőtt bevezette azt a zseniális elvet, hogy szinte bármilyen függvényt fel lehet bontani egyszerű hullámok összegére...
Röviden: ezen a napon véget ért a Rásidún Kalifátus, megalakult az American League, Karl Benz levédette az első benzinüzemű autót, és Magyarország elsőként a keleti blokkból diplomáciai kapcsolatot létesített Dél-Koreával...
Az Egyesült Államok Energiaügyi Minisztériuma új kezdeményezést indít a nukleáris üzemanyag-ellátási lánc megerősítésére, miután a nukleáris energia iránti kereslet ismét megugrott – főleg az óriási energiaigényű, úgynevezett hiperskálerek adatközpontjai miatt...
A Google DeepMind új MI-modellje, az AlphaGenome alapjaiban változtathatja meg a DNS, vagyis az élet teljes receptjének értelmezését, és utat nyithat a betegségek megértésében és az új gyógyszerek felfedezésében...
Egy forradalmi nanotechnológiai fejlesztés lehetővé teszi, hogy a szervezetből célzottan távolítsák el azokat a fehérjéket, amelyek például a demencia, illetve a daganatok kialakulásáért felelősek...
A nátrium-ion (Na-ion) akkumulátorok friss fejlesztései igazi áttörést jelenthetnek az energiatárolásban, és könnyen leválthatják a jelenleg uralkodó lítium-ion (Li-ion) akkumulátorokat...
A UPS újabb nagyszabású leépítést jelentett be: idén 30 ezer állás kerülhet veszélybe, ahogy a cég tovább csökkenti az együttműködését az egykori legnagyobb partnerével, az Amazonnal...
Claude, az Anthropic által fejlesztett MI-chatbot, egy különleges, 80 oldalas „lélekkel” rendelkezik, amely meghatározza a személyiségét és alapvető szabályait...
Kezdetben az amerikai technológiai óriások játszották a főszerepet a mesterséges intelligencia által támogatott kódolás piacán, de most új európai rivális lépett színre...
A kaliforniai Mountain View-ban található Számítógép-történeti Múzeum mostantól virtuálisan is látogatható, így már nem kell Amerikáig utazni ahhoz, hogy valaki belemerüljön a digitális kor legfontosabb ereklyéi közé...