Az MI-csata folytatódik: az OpenAI új képgeneráló funkciót dobott piacra
Egy keddi élő közvetítés során az OpenAI vezérigazgatója, Sam Altman bejelentette az első jelentős frissítést a képgenerálási képességek terén több mint egy év után. A ChatGPT mostantól képes a vállalat modelljét felhasználva natív módon létrehozni és módosítani képeket és fotókat. A GPT-4o régóta az MI-alapú csevegőrobot-platform alapja, de eddig a modell kizárólag szöveg generálására és szerkesztésére volt képes – képek előállítására nem.
Altman elmondta, hogy a GPT-4o natív képgenerálási funkciója már ma elérhető a ChatGPT-ben és a Sorában, az OpenAI MI-videógeneráló termékében, a vállalat havi 200 dolláros (kb. 71 ezer forintos) Pro előfizetői számára. Az OpenAI szerint a funkció hamarosan elérhetővé válik a Plus és ingyenes ChatGPT felhasználók, valamint a vállalat API-szolgáltatását használó fejlesztők számára is.
Pontosabb, részletesebb képek
A képkimenettel rendelkező GPT-4o “gondolkodik” egy kicsit tovább, mint az a képgenerálási modell, amelyet hatékonyan helyettesít, hogy – az OpenAI leírása szerint – pontosabb és részletesebb képeket készítsen. A GPT-4o képes meglévő képek szerkesztésére, beleértve az embereket ábrázoló képeket is, átalakítva azokat vagy “befestve” olyan részleteket, mint az előtérben vagy háttérben lévő tárgyak.
Az új képfunkció működtetéséhez az OpenAI elmondta, hogy a GPT-4o-t “nyilvánosan elérhető adatokon”, valamint a vállalatnak a Shutterstockhoz hasonló cégekkel kötött partnerségeiből származó saját adatokon képezték ki.
Jogi kérdések
Sok generatív MI-szolgáltató versenyképes előnynek tekinti a tréningadatokat, ezért ezeket és a kapcsolódó információkat titokban tartják. Az adatokkal kapcsolatos részletek azonban potenciális szellemi tulajdoni perek forrásai is lehetnek, ami szintén visszatarthatja a vállalatokat attól, hogy túl sokat hozzanak nyilvánosságra.
“Tiszteletben tartjuk a művészek jogait abban, ahogy a kimenetet kezeljük, és vannak olyan szabályaink, amelyek megakadályozzák, hogy bármely élő művész munkáját közvetlenül utánzó képeket generáljunk” – mondta Brad Lightcap, az OpenAI operatív igazgatója.
Az OpenAI kínál egy leiratkozási űrlapot, amely lehetővé teszi az alkotók számára, hogy kérjék műveik eltávolítását a tréningadatkészleteiből. A vállalat azt is állítja, hogy tiszteletben tartja azokat a kéréseket, amelyek megtiltják webes szkennelő botjainak, hogy tréningadatokat – többek között képeket – gyűjtsenek a webhelyekről.
A Waymo friss tőkebevonása 5800 milliárd forintot hozott a cég kasszájába, hogy önvezető taxiparkját az USA számos új városába, sőt a világ több pontjára is eljuttassa...
Elon Musk újra megkeverte a lapokat: a SpaceX bekebelezte saját MI-cégét, az xAI-t, így egy fedél alá kerülnek a rakéták, a műholdas internet, a mesterséges intelligencia és a világelső, szólásszabadságot hirdető közösségi platform...
Érdekes kérdés, mivel készül a Samsung az okostelefon-piacon: néhány nap alatt teljesen elfogyott a Galaxy Z TriFold, amely minden előjel nélkül, csekély hírveréssel került forgalomba, és meglepően magas, 1 070 000 forint körüli áron talált gazdára...
🌌 Az elmúlt 24 órában a Nap 4366-os aktív foltja elképesztő, 27 napkitörést produkált, ráadásul ezek között volt az utóbbi évek legerősebb kitörése is...
Kína hamarosan betiltja az elektromos autókon az elrejtett ajtókilincseket, miután több tragikus baleset nyomán világszerte megkérdőjelezték ezt a megoldást, amelyet a Tesla tett elterjedtté...
💻 A SoftBank leányvállalata, a Saimemory és az Intel közös fejlesztésbe kezd, hogy megalkossa a következő generációs MI-hez és nagyteljesítményű számítástechnikához készült memóriatechnológiát...
A kínai hatóságok betiltották a rejtett, karosszériába süllyesztett autókilincseket, amelyek az utóbbi években egyre népszerűbbé váltak az autógyártók körében, főként aerodinamikai és dizájn okokból...
📱 Az okostelefonok szoftverei folyamatosan frissülnek, ezért néha nehéz követni, mikor és miért változik meg egy-egy alkalmazás kinézete vagy működése...
🕵 A népszerű Notepad++ szöveg- és kódszerkesztő felhasználói hónapokon át veszélyben voltak, miután a szoftver frissítéseit terjesztő szervereket tavaly feltörték...
🚗 A Waymo, az Alphabet önvezető autós cége újabb óriási befektetést kapott: 5,7 billió forint (16 milliárd USD) tőkét vont be, amellyel globálisan, több mint egy tucat új városban – köztük Tokióban és Londonban – terjeszti ki sofőr nélküli taxiszolgáltatását még az idén...
A Moltbook nevű közösségi oldal azzal büszkélkedik, hogy MI-ügynököknek kínál közösségi teret – azonban most kiderült, hogy több ezer emberi felhasználó adatait tette nyilvánossá egy hiányos biztonsági védelem miatt...
Januári Windows-frissítés után egyre több felhasználó szembesül azzal a bosszantó hibával, hogy számítógépe nem képes leállni vagy hibernálni, hanem újraindul...
Úgy tűnik, hamarosan véget ér a klasszikus, lapos okostelefonok időszaka. Egyre erősebbek a pletykák arról, hogy az Apple 2026 végén dobhatja piacra első összecsukható telefonját, ráadásul dolgozik egy kagylóhéj-formájú, vagyis flip kivitelű modellen is...
Egy veszélyes, GlassWorm nevű kártevő új módszert talált arra, hogy macOS-rendszereken fejlesztők jelszavait, kriptotárca-adatait és bizalmas információit lopja el...
Elképesztő, hogy ma már nemcsak a földön, de a magasban is élvezhetjük a stabil, gyors internetet: a Starlink műholdas Wi-Fi már a United Airlines járatain is úgy működik, mintha csak otthon lennél...
🔪 Több mint 230 rosszindulatú kiegészítő jelent meg kevesebb mint egy hét alatt az OpenClaw (korábbi nevén Moltbot és ClawdBot) személyes MI asszisztens hivatalos regisztrációs oldalán és a GitHubon...
A memóriapiacon rég nem látott válság van kibontakozóban: 2026 első negyedévében minden eddiginél gyorsabban nőnek a DRAM és a NAND flash memóriák árai...
🔎 Felmerül a kérdés, hogy létezik-e olyan speciális távcső, amely egyszerre szolgálja ki a hobbifotósokat, a madármegfigyelőket és a csillagászat szerelmeseit is...