Az MI-csata folytatódik: az OpenAI új képgeneráló funkciót dobott piacra
Egy keddi élő közvetítés során az OpenAI vezérigazgatója, Sam Altman bejelentette az első jelentős frissítést a képgenerálási képességek terén több mint egy év után. A ChatGPT mostantól képes a vállalat modelljét felhasználva natív módon létrehozni és módosítani képeket és fotókat. A GPT-4o régóta az MI-alapú csevegőrobot-platform alapja, de eddig a modell kizárólag szöveg generálására és szerkesztésére volt képes – képek előállítására nem.
Altman elmondta, hogy a GPT-4o natív képgenerálási funkciója már ma elérhető a ChatGPT-ben és a Sorában, az OpenAI MI-videógeneráló termékében, a vállalat havi 200 dolláros (kb. 71 ezer forintos) Pro előfizetői számára. Az OpenAI szerint a funkció hamarosan elérhetővé válik a Plus és ingyenes ChatGPT felhasználók, valamint a vállalat API-szolgáltatását használó fejlesztők számára is.
Pontosabb, részletesebb képek
A képkimenettel rendelkező GPT-4o “gondolkodik” egy kicsit tovább, mint az a képgenerálási modell, amelyet hatékonyan helyettesít, hogy – az OpenAI leírása szerint – pontosabb és részletesebb képeket készítsen. A GPT-4o képes meglévő képek szerkesztésére, beleértve az embereket ábrázoló képeket is, átalakítva azokat vagy “befestve” olyan részleteket, mint az előtérben vagy háttérben lévő tárgyak.
Az új képfunkció működtetéséhez az OpenAI elmondta, hogy a GPT-4o-t “nyilvánosan elérhető adatokon”, valamint a vállalatnak a Shutterstockhoz hasonló cégekkel kötött partnerségeiből származó saját adatokon képezték ki.
Jogi kérdések
Sok generatív MI-szolgáltató versenyképes előnynek tekinti a tréningadatokat, ezért ezeket és a kapcsolódó információkat titokban tartják. Az adatokkal kapcsolatos részletek azonban potenciális szellemi tulajdoni perek forrásai is lehetnek, ami szintén visszatarthatja a vállalatokat attól, hogy túl sokat hozzanak nyilvánosságra.
“Tiszteletben tartjuk a művészek jogait abban, ahogy a kimenetet kezeljük, és vannak olyan szabályaink, amelyek megakadályozzák, hogy bármely élő művész munkáját közvetlenül utánzó képeket generáljunk” – mondta Brad Lightcap, az OpenAI operatív igazgatója.
Az OpenAI kínál egy leiratkozási űrlapot, amely lehetővé teszi az alkotók számára, hogy kérjék műveik eltávolítását a tréningadatkészleteiből. A vállalat azt is állítja, hogy tiszteletben tartja azokat a kéréseket, amelyek megtiltják webes szkennelő botjainak, hogy tréningadatokat – többek között képeket – gyűjtsenek a webhelyekről.
A vállalatok zöme továbbra is tehetetlen a harmadik szintű MI-ügynökök jelentette fenyegetésekkel szemben, miközben ezek az automatizált rendszerek egyre bátrabban lépnek át a biztonsági vonalakon...
🔴 Egy, a Földtől 500 millió fényévre található galaxisban két óriási fekete lyuk sodródik végzetes összeütközés felé, amelynek hatásait akár száz éven belül is megérezheti a Föld...
🚀 Új kutatások szerint a Colorado-folyó nem egyből vájta ki a Grand Canyont, hanem előbb egy hatalmas tóban gyűlt össze, és csak később szakadt át, hogy megkezdje ma ismert útját a mély szurdokon keresztül...
A dizájnszoftverek piacára új kihívó érkezett: az Anthropic bemutatta legújabb fejlesztését, a Claude Design-t, amely képes teljes értékű, vizuálisan kidolgozott terveket, interaktív prototípusokat, prezentációkat, one-pagereket és marketinganyagokat készíteni egyszerű szöveges utasításokra...
💰 A Kirgizisztánban bejegyzett, amerikai szankciókkal sújtott Grinex kriptotőzsde bejelentette, hogy leállítja működését, miután 5,5 milliárd forint (15 millió dollár) értékű vagyont loptak el tőle – állítólag „barátságtalan országok” titkosszolgálatainak közreműködésével...
A NASA ismét bekapcsolódott az Európai Űrügynökség (ESA) Rosalind Franklin marsjárójának küldetésébe, amelynek célja az élet nyomainak keresése a vörös bolygón...
💳 Az ellopott bankkártyaadatokkal kereskedő alvilági piac mindig is ingatag, kiszámíthatatlan terepnek számított, ahol még a tapasztalt bűnözők is gyakran esnek csalás, lehúzás vagy hatósági lebuktatás áldozatául...
Áprilisban jelentős mérföldkőhöz érkezett a Google: az Android Canary 2604 verziója már nemcsak a legújabb Pixel 8-as sorozaton fut, hanem immár elérhető a Pixel 6 és Pixel 7 szériára, valamint a Pixel Foldra és a Pixel Tabletre is...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Sight Words: Dolch Coach (iPhone/iPad)Ez a játék a Dolch Sight Words mind az öt szintjét lefedi, így segít elsajátítani az automatikus szófelismerést, ami elengedhetetlen a funkcionális írástudáshoz...
Óriási lendülettel indult az MI-őrület az Egyesült Államokban, a világ techközpontjai dollárszázmilliárdokat ölnek egyre nagyobb és energiaéhes adatközpontok építésébe...
Az elmúlt években hatalmas, 263%-os növekedés történt a szoftverek sérülékenységi bejelentéseiben, ezért az amerikai Nemzeti Szabványügyi és Technológiai Intézet (NIST) jelentősen szűkíti a CVE-adatok részletes feldolgozásának körét...
A Galaxy Z TriFold, a Samsung úttörő, háromszor hajtható okostelefonja villámgyorsan elfogyott a legutóbbi kiárusításon, így hivatalosan is elérhetetlenné vált...
Az Atlanti-óceán egyik legfontosabb áramlata, az úgynevezett Atlanti meridionális áramlási rendszer (AMOC) összeomlása jóval valószínűbb, mint eddig hittük – derült ki egy friss kutatásból...
Több ezer évvel ezelőtt az Északi-tenger feneke alatt rejtőző Doggerland területe buja erdők otthona volt, ahol tölgy, szil és mogyoró dúsan terjedtek már több mint 16 000 évvel ezelőtt – jóval korábban, mint azt bárki hitte volna...
A Live Nation nevét már mindenki kívülről fújja, aki koncertre vágyik – és aki kisírt szemmel nézi a jegyárakat, vagy épp a végösszeget, amikor beütnek a különféle szolgáltatási díjak...
Érdemes megvizsgálni, milyen újdonságot kínál a Mozilla az MI világában. Az MZLA Technologies, a Mozilla leányvállalata bemutatta a Thunderbolt nevű nyílt forráskódú MI-klienst, amely a teljes irányításra és az önálló futtatásra helyezi a hangsúlyt, mégpedig a felhőtől való függőség nélkül...
💻 Az Intel idén tovább bővíti 2026-os mobilprocesszor-palettáját, méghozzá a pénztárcabarát Core Series 3 chipekkel, melyeket Wildcat Lake kódnéven fejlesztettek...