Az MI-csata folytatódik: az OpenAI új képgeneráló funkciót dobott piacra
Egy keddi élő közvetítés során az OpenAI vezérigazgatója, Sam Altman bejelentette az első jelentős frissítést a képgenerálási képességek terén több mint egy év után. A ChatGPT mostantól képes a vállalat modelljét felhasználva natív módon létrehozni és módosítani képeket és fotókat. A GPT-4o régóta az MI-alapú csevegőrobot-platform alapja, de eddig a modell kizárólag szöveg generálására és szerkesztésére volt képes – képek előállítására nem.
Altman elmondta, hogy a GPT-4o natív képgenerálási funkciója már ma elérhető a ChatGPT-ben és a Sorában, az OpenAI MI-videógeneráló termékében, a vállalat havi 200 dolláros (kb. 71 ezer forintos) Pro előfizetői számára. Az OpenAI szerint a funkció hamarosan elérhetővé válik a Plus és ingyenes ChatGPT felhasználók, valamint a vállalat API-szolgáltatását használó fejlesztők számára is.
Pontosabb, részletesebb képek
A képkimenettel rendelkező GPT-4o “gondolkodik” egy kicsit tovább, mint az a képgenerálási modell, amelyet hatékonyan helyettesít, hogy – az OpenAI leírása szerint – pontosabb és részletesebb képeket készítsen. A GPT-4o képes meglévő képek szerkesztésére, beleértve az embereket ábrázoló képeket is, átalakítva azokat vagy “befestve” olyan részleteket, mint az előtérben vagy háttérben lévő tárgyak.
Az új képfunkció működtetéséhez az OpenAI elmondta, hogy a GPT-4o-t “nyilvánosan elérhető adatokon”, valamint a vállalatnak a Shutterstockhoz hasonló cégekkel kötött partnerségeiből származó saját adatokon képezték ki.
Jogi kérdések
Sok generatív MI-szolgáltató versenyképes előnynek tekinti a tréningadatokat, ezért ezeket és a kapcsolódó információkat titokban tartják. Az adatokkal kapcsolatos részletek azonban potenciális szellemi tulajdoni perek forrásai is lehetnek, ami szintén visszatarthatja a vállalatokat attól, hogy túl sokat hozzanak nyilvánosságra.
“Tiszteletben tartjuk a művészek jogait abban, ahogy a kimenetet kezeljük, és vannak olyan szabályaink, amelyek megakadályozzák, hogy bármely élő művész munkáját közvetlenül utánzó képeket generáljunk” – mondta Brad Lightcap, az OpenAI operatív igazgatója.
Az OpenAI kínál egy leiratkozási űrlapot, amely lehetővé teszi az alkotók számára, hogy kérjék műveik eltávolítását a tréningadatkészleteiből. A vállalat azt is állítja, hogy tiszteletben tartja azokat a kéréseket, amelyek megtiltják webes szkennelő botjainak, hogy tréningadatokat – többek között képeket – gyűjtsenek a webhelyekről.
🤔 Elon Musk komolyan harcba száll az OpenAI ellen, és most újra rátett egy lapáttal: ha megkapná azt a fenséges 150 milliárd dolláros (azaz 54 ezermilliárd forintos) kártérítést, nem engedné a saját zsebébe csorogni...
A tavalyi év minden eddiginél súlyosabb volt az Egyesült Államokban a digitális csalások területén: a veszteségek meghaladták a 21 milliárd dollárt (körülbelül 7800 milliárd forintot)...
A Sony új, Bravia True RGB Mini LED technológiával rukkolt elő, amellyel minden eddiginél élénkebb színeket és nagyobb fényerőt ígér a házimozi-szerelmeseinek...
Kezdetben csupán célzott próbálkozásoknak tűntek az iráni kibertámadások, de mostanra a támadók fokozott lendülettel vették célba az Egyesült Államok legkritikusabb infrastruktúráját...
Az űrkutatás történetében ritka pillanatnak lehettünk tanúi: az Artemis II legénysége minden eddiginél távolabb jutott a Földtől, amikor az Orion űrhajó megkezdte holdkerülő repülését a Hold túlsó oldala felett...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. VestClaw (iPhone/iPad)A VestClaw egy innovatív befektetési alkalmazás, amely gördülékennyé és érthetővé teszi a befektetések világát...
😱 Ilyen, amikor valaki végre rálel egy olyan alkalmazásra, amely az egész filmet nyomon követi, és még a horrorjelenetek előtt is szól, ha közeleg egy hirtelen ijesztés...
Mostantól minden eddiginél könnyebb lesz a játékvezérlőket testre szabni Androidon. Az Android 17 béta elhozta a natív kontroller-átkiosztás funkciót, amellyel egyszerűen lehet egyedi gombkiosztásokat készíteni: tetszés szerint átvariálhatók a gombok, karok és ravaszok működése, méghozzá rendszerszinten...
Az AI-RAN, vagyis a mesterséges intelligenciával működő rádiós hálózat teljesen új dimenziót nyit a vezeték nélküli vállalati infrastruktúrák világában...
🔍 A világ egyik legnagyobb szervergyártója, a Supermicro, nagyszabású belső vizsgálatot indított, miután a cég egyik társalapítóját, Yih-Shyan Wally Liaw-t azzal vádolták meg, hogy több milliárd dollár értékű, Nvidia grafikus gyorsítókkal felszerelt szervereket csempészett Kínába, megsértve az amerikai exportkorlátozásokat...
🚦 Egy kínaiul beszélő hackercsoport, a Storm-1175, elképesztő gyorsasággal képes vállalatok és szervezetek teljes rendszereit feltörni, adatokat ellopni, majd zsarolóvírust bevetni...
📦 Egy lényeges szempont, hogy a felhőalapú vállalati adatok zöme ma már objektumtárolókban, elsősorban az Amazon S3-ban található, miközben az MI-alapú ügynökök és fejlesztők továbbra is hagyományos fájlrendszerekben gondolkodnak...
Az Oregon State University kutatói korszakalkotó felfedezést tettek az Alzheimer-kór vizsgálatában: sikerült élőben megfigyelni, valójában hogyan károsítja sejtszinten az agyat a betegség...
🎮 Ha már untad, hogy a Vision Pro (az Apple vegyes valóságú headsetje) csak almás tartalmakat engedett, most jön a nagy fordulat: kapaszkodj, mert a Valve végre kihozta a natív Steam Link appot a Vision Próra!..
📷 Az X újabb fejlesztései révén sokkal többet hoz ki a beépített fotószerkesztőből: az MI-alapú Grok segítségével már egyszerű, beszélgetős utasításokkal lehet képeket szerkeszteni, továbbá lehetőség nyílik arcok elhomályosítására és feliratok elhelyezésére is...