Az MI-csata folytatódik: az OpenAI új képgeneráló funkciót dobott piacra
Egy keddi élő közvetítés során az OpenAI vezérigazgatója, Sam Altman bejelentette az első jelentős frissítést a képgenerálási képességek terén több mint egy év után. A ChatGPT mostantól képes a vállalat modelljét felhasználva natív módon létrehozni és módosítani képeket és fotókat. A GPT-4o régóta az MI-alapú csevegőrobot-platform alapja, de eddig a modell kizárólag szöveg generálására és szerkesztésére volt képes – képek előállítására nem.
Altman elmondta, hogy a GPT-4o natív képgenerálási funkciója már ma elérhető a ChatGPT-ben és a Sorában, az OpenAI MI-videógeneráló termékében, a vállalat havi 200 dolláros (kb. 71 ezer forintos) Pro előfizetői számára. Az OpenAI szerint a funkció hamarosan elérhetővé válik a Plus és ingyenes ChatGPT felhasználók, valamint a vállalat API-szolgáltatását használó fejlesztők számára is.
Pontosabb, részletesebb képek
A képkimenettel rendelkező GPT-4o “gondolkodik” egy kicsit tovább, mint az a képgenerálási modell, amelyet hatékonyan helyettesít, hogy – az OpenAI leírása szerint – pontosabb és részletesebb képeket készítsen. A GPT-4o képes meglévő képek szerkesztésére, beleértve az embereket ábrázoló képeket is, átalakítva azokat vagy “befestve” olyan részleteket, mint az előtérben vagy háttérben lévő tárgyak.
Az új képfunkció működtetéséhez az OpenAI elmondta, hogy a GPT-4o-t “nyilvánosan elérhető adatokon”, valamint a vállalatnak a Shutterstockhoz hasonló cégekkel kötött partnerségeiből származó saját adatokon képezték ki.
Jogi kérdések
Sok generatív MI-szolgáltató versenyképes előnynek tekinti a tréningadatokat, ezért ezeket és a kapcsolódó információkat titokban tartják. Az adatokkal kapcsolatos részletek azonban potenciális szellemi tulajdoni perek forrásai is lehetnek, ami szintén visszatarthatja a vállalatokat attól, hogy túl sokat hozzanak nyilvánosságra.
“Tiszteletben tartjuk a művészek jogait abban, ahogy a kimenetet kezeljük, és vannak olyan szabályaink, amelyek megakadályozzák, hogy bármely élő művész munkáját közvetlenül utánzó képeket generáljunk” – mondta Brad Lightcap, az OpenAI operatív igazgatója.
Az OpenAI kínál egy leiratkozási űrlapot, amely lehetővé teszi az alkotók számára, hogy kérjék műveik eltávolítását a tréningadatkészleteiből. A vállalat azt is állítja, hogy tiszteletben tartja azokat a kéréseket, amelyek megtiltják webes szkennelő botjainak, hogy tréningadatokat – többek között képeket – gyűjtsenek a webhelyekről.
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. VSep (iPhone/iPad)A VSep egy mesterséges intelligencia alapú alkalmazás, amely képes a zeneszámokból elkülöníteni az éneksávokat...
M. C. Escher képeiben minden benne van, amitől a matematika hirtelen menőnek tűnik: az örökké visszatérő, önmagát ismétlő mintázatok, amelyek egyre kisebb és kisebb méretben folytatódnak a rajzon belül, mintha egy vizuális örökkévalóság lenne...
🎵 Egy lényeges szempont, hogy Steven Soderbergh, aki olyan kasszasikereket rendezett, mint a Forgalom (Traffic), a Tripla vagy semmi (Ocean’s Eleven) vagy a Magic Mike (Magic Mike), ezúttal John Lennon utolsó interjújáról készít dokumentumfilmet...
🤤 Egy új belga kutatás a Goyet-barlangból származó neandervölgyi maradványok alapján megállapította, hogy körülbelül 41 000–45 000 évvel ezelőtt ezek az ősemberek szelektív kannibalizmust folytattak...
Megvizsgálandó, miként fordult meg az MI-verseny szele az Apple javára, miközben a nagy tech cégek dollármilliárdokat öntöttek szuperszámítógépekbe, tréningadatokba és szoftverfejlesztésbe...
Nem csoda, hogy rég nem látott felháborodás söpört végig a Kindle-táboron, miután az Amazon bejelentette: hamarosan véget ér a legöregebb e-olvasók támogatása...
🦁 A héten az Anthropic előállt a Mythos nevű mesterséges intelligenciájával, amely állítólag döbbenetes pontossággal találja meg és használja ki a nulladik napi sérülékenységeket...
Az amerikai védelmi minisztérium jelentősen növelni tervezi a lézerfegyverek és más irányított energiafegyverek fejlesztésére szánt forrásokat a 2027-es pénzügyi évben...
👕 Az Apple évek óta mindenki kíváncsiságát csigázza a saját okosszemüvegével, és úgy néz ki, már nem kell sokat várni: akár négy különböző modellből választhatsz majd, ha végre boltokba kerülnek...
Egy súlyos sérülékenység jelent meg a Marimo nevű nyílt forráskódú, Python-alapú notebook-platformon, amelyet adatkutatók, fejlesztők és MI-szakemberek használnak világszerte...
🔎 Ma már a legmodernebb tudományos módszerek segítségével kutatók képesek feltárni, milyen állatok bőréből készült évszázadokkal ezelőtt a kéziratok pergamenje – mindezt úgy, hogy közben a legkisebb kárt sem tesznek a felbecsülhetetlen értékű történelmi dokumentumokban...
Egy lényeges szempont, hogy az amerikai háztartások 71%-ában a szolgáltató adja a routert, amelyet a fogyasztók nem maguk választanak vagy cserélnek le...
A kínai mesterséges intelligencia-forradalom hihetetlen tempóban halad előre: a belföldi fejlesztők mostanra önálló kifejezést is alkottak a „token” fogalmára...
📷 Tipikus eset, amikor egy gyártó bátran szakít a korábbi trendekkel: az OPPO Find X9 Ultra radikális váltást jelent a matt üveg elődhöz képest, és markáns Hasselblad kameramodullal rendelkezik...
💊 A mellrák a világ női lakosságának leggyakrabban diagnosztizált daganatos betegsége, évente 2,3 millió új esetet regisztrálnak, és sajnos mintegy 670 ezren halnak bele...
💸 A gépi tanuláson alapuló biztonsági rendszerek megbízhatósága az adatok stabilitásán múlik, ám a bemeneti adatok statisztikai sajátosságai idővel változhatnak...
Mai összeállításunkban nagy fordulatok és tragédiák sorakoznak: Kossuth Lajos felolvassa a magyar Függetlenségi Nyilatkozatot, bejelentik a katyni tömegmészárlás felfedezését, az UPU elismeri a Kínai Népköztársaságot, Tiger Woods rekordot dönt a Mastersen, és az USA ledobja a legnagyobb nem nukleáris fegyverét Afganisztánban...
Ez a jelenség jól illusztrálható azzal, hogy a mobilpiacot ugyan az Ultra és Pro modellek fénye ragyogja be, de a hétköznapi zsebekben mégis a standard változatok landolnak leggyakrabban...