Az MI-csata folytatódik: az OpenAI új képgeneráló funkciót dobott piacra
Egy keddi élő közvetítés során az OpenAI vezérigazgatója, Sam Altman bejelentette az első jelentős frissítést a képgenerálási képességek terén több mint egy év után. A ChatGPT mostantól képes a vállalat modelljét felhasználva natív módon létrehozni és módosítani képeket és fotókat. A GPT-4o régóta az MI-alapú csevegőrobot-platform alapja, de eddig a modell kizárólag szöveg generálására és szerkesztésére volt képes – képek előállítására nem.
Altman elmondta, hogy a GPT-4o natív képgenerálási funkciója már ma elérhető a ChatGPT-ben és a Sorában, az OpenAI MI-videógeneráló termékében, a vállalat havi 200 dolláros (kb. 71 ezer forintos) Pro előfizetői számára. Az OpenAI szerint a funkció hamarosan elérhetővé válik a Plus és ingyenes ChatGPT felhasználók, valamint a vállalat API-szolgáltatását használó fejlesztők számára is.
Pontosabb, részletesebb képek
A képkimenettel rendelkező GPT-4o “gondolkodik” egy kicsit tovább, mint az a képgenerálási modell, amelyet hatékonyan helyettesít, hogy – az OpenAI leírása szerint – pontosabb és részletesebb képeket készítsen. A GPT-4o képes meglévő képek szerkesztésére, beleértve az embereket ábrázoló képeket is, átalakítva azokat vagy “befestve” olyan részleteket, mint az előtérben vagy háttérben lévő tárgyak.
Az új képfunkció működtetéséhez az OpenAI elmondta, hogy a GPT-4o-t “nyilvánosan elérhető adatokon”, valamint a vállalatnak a Shutterstockhoz hasonló cégekkel kötött partnerségeiből származó saját adatokon képezték ki.
Jogi kérdések
Sok generatív MI-szolgáltató versenyképes előnynek tekinti a tréningadatokat, ezért ezeket és a kapcsolódó információkat titokban tartják. Az adatokkal kapcsolatos részletek azonban potenciális szellemi tulajdoni perek forrásai is lehetnek, ami szintén visszatarthatja a vállalatokat attól, hogy túl sokat hozzanak nyilvánosságra.
“Tiszteletben tartjuk a művészek jogait abban, ahogy a kimenetet kezeljük, és vannak olyan szabályaink, amelyek megakadályozzák, hogy bármely élő művész munkáját közvetlenül utánzó képeket generáljunk” – mondta Brad Lightcap, az OpenAI operatív igazgatója.
Az OpenAI kínál egy leiratkozási űrlapot, amely lehetővé teszi az alkotók számára, hogy kérjék műveik eltávolítását a tréningadatkészleteiből. A vállalat azt is állítja, hogy tiszteletben tartja azokat a kéréseket, amelyek megtiltják webes szkennelő botjainak, hogy tréningadatokat – többek között képeket – gyűjtsenek a webhelyekről.
🖥 A holland kormány bejelentette, hogy elindította saját, önhosztolt Git-platformját code.overheid.nl néven, amelynek célja, hogy csökkentse a függőséget az amerikai technológiai óriásoktól, például a Microsoft tulajdonában lévő GitHubtól...
A mesterséges intelligencia mind több weboldalt böngész át, ám ezek az oldalak még mindig embereknek készülnek, tele felesleges részletekkel, amelyeket a gépek úgyis figyelmen kívül hagynak...
📷 A Nikon egy újabb, fix objektíves, full-frame szenzoros kompaktgépen dolgozik, amely a pletykák szerint a Fujifilm X100VI, a Ricoh GR IV, a Sony RX1R III és a Leica Q3 vetélytársaként lépne piacra...
Jeremy Renner újra belebújik Mike McLusky bőrébe, hogy a bűn és a rendőri erőszak uralta Kingstownban egyensúlyozzon a törvény és a bűnözői alvilág között...
Többek között egy elképesztően kockázatos magzati műtét, egy adatbázist 9 másodperc alatt eltüntető MI-ügynök és az univerzum vártnál korábbi pusztulásának lehetősége borzolták a tudományos világot a héten...
A Dire Marsh biokutató-laborjának sötét bugyraiban feltűnő, világító, rózsaszín graffitit találunk: THAKGODITSYOU, mindig kicsit másképp, vibrálóan ismétlődve a veszélyek között...
Ez a jelenség jól illusztrálható azzal, hogy sokan elsőként a tigris csíkos bundáját és az oroszlán sörényét hozzák fel, ha a két nagymacska különbségeiről esik szó...
📈 A bitcoin árfolyama rövid, iráni hírek okozta megtorpanás után újra magára talált: szombat reggel már 78 000 dollár, vagyis közel 28 millió forint fölött járt Ázsiában...
Napvilágot látott a Digital Asset Market Clarity Act (Digitális Eszközpiac Átláthatósági Törvény) friss szövege, amely jelentősen átalakítja a stabilcoinokkal kapcsolatos szabályozást az Egyesült Államokban...
Az elmúlt hét sok izgalmat hozott a tech világában, alaposan felborítva az eddigi elképzeléseket arról, mit tartogat számunkra a digitális innováció...
A Spirit Airlines 34 év után végleg lehúzta a rolót. A jellegzetes sárga gépeket üzemeltető, ultraolcsó légitársaság minden járatát azonnali hatállyal leállította, és a mintegy 17 000 dolgozó munkaviszonya is megszűnt...
A Bitcoin jövője körül számos kérdés merült fel a kvantumszámítógépek megjelenésével kapcsolatban, hiszen ezek az új gépek könnyen megfejthetik a régi típusú bitcointárcák nyilvános kulcsait...
🥊 A hétvégén a tokiói Tokyo Dome ad otthont az év egyik legizgalmasabb bokszmeccsének, ahol Naoya Inoue és Junto Nakatani feszül egymásnak az egyesített szuperharmatsúlyú világbajnoki címekért...
💻 Apple hosszú évek óta erős szereplője az asztali számítógépek piacának kifinomult formatervezéssel és erős hardverrel, különösen az M-sorozatú chipeknek köszönhetően...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Waltz of the Wizard (iPhone/iPad)A Waltz of the Wizard egy fizika alapú, első személyű varázslószimulátor, amely klasszikus fantasy élményt kínál...
🤖 Az utóbbi években a fejlesztőknek még komoly infrastruktúrára volt szükségük ahhoz, hogy nagyméretű nyelvi modelleket (LLM) működtessenek: indexelés, lekérdezőmotorok, adat-visszakeresést végző folyamatok és aprólékosan vezérelt feladatsorok tartották életben a rendszereket...
Amerika egyik legismertebb tudósa, Neil deGrasse Tyson asztrofizikus saját temetkezési terveiről fejtette ki, mi történik velünk halálunk után – és miért a hagyományos temetkezést részesíti előnyben a hamvasztással szemben...
A fejlesztők által használt MI-keretrendszerek drasztikusan átalakulnak. A bonyolult programozói környezetek visszaszorulnak, helyüket egyre inkább átlátható, hatékony és természetes nyelvű megoldások veszik át...
Az Alberta Investment Management Corporation (AIMCo), Kanada egyik óriásnyugdíjalapja, nagyot lépett: idén év elején 1 382 000 darab MSTR-részvényt (MicroStrategy) vásárolt, összesen 62,6 milliárd forintért (172,5 millió dollár)...
Újabb, a játékmenetet megtörő hibát kellett kezelnie a Blizzardnak a Diablo IV-ben (Diablo 4): a Limitless Rage nevű legendás tárgy aspektusa túlzottan hatékonynak bizonyult, ezért a fejlesztők gyorsan letiltották a használatát...
A nagyvállalati MI bevezetése eddig sokszor megrekedt, mert a háttérrendszerek egyszerűen nem voltak felkészítve arra, hogy ügynökalapú munkavégzést támogassanak...
🤠 A Far Far West meglepetéssikert aratott a Steamen: a vadnyugati, többjátékos robotcowboy-lövöldözős játék mindössze két nap alatt 250 ezres eladást produkált világszerte...