Az MI-csata folytatódik: az OpenAI új képgeneráló funkciót dobott piacra
Egy keddi élő közvetítés során az OpenAI vezérigazgatója, Sam Altman bejelentette az első jelentős frissítést a képgenerálási képességek terén több mint egy év után. A ChatGPT mostantól képes a vállalat modelljét felhasználva natív módon létrehozni és módosítani képeket és fotókat. A GPT-4o régóta az MI-alapú csevegőrobot-platform alapja, de eddig a modell kizárólag szöveg generálására és szerkesztésére volt képes – képek előállítására nem.
Altman elmondta, hogy a GPT-4o natív képgenerálási funkciója már ma elérhető a ChatGPT-ben és a Sorában, az OpenAI MI-videógeneráló termékében, a vállalat havi 200 dolláros (kb. 71 ezer forintos) Pro előfizetői számára. Az OpenAI szerint a funkció hamarosan elérhetővé válik a Plus és ingyenes ChatGPT felhasználók, valamint a vállalat API-szolgáltatását használó fejlesztők számára is.
Pontosabb, részletesebb képek
A képkimenettel rendelkező GPT-4o “gondolkodik” egy kicsit tovább, mint az a képgenerálási modell, amelyet hatékonyan helyettesít, hogy – az OpenAI leírása szerint – pontosabb és részletesebb képeket készítsen. A GPT-4o képes meglévő képek szerkesztésére, beleértve az embereket ábrázoló képeket is, átalakítva azokat vagy “befestve” olyan részleteket, mint az előtérben vagy háttérben lévő tárgyak.
Az új képfunkció működtetéséhez az OpenAI elmondta, hogy a GPT-4o-t “nyilvánosan elérhető adatokon”, valamint a vállalatnak a Shutterstockhoz hasonló cégekkel kötött partnerségeiből származó saját adatokon képezték ki.
Jogi kérdések
Sok generatív MI-szolgáltató versenyképes előnynek tekinti a tréningadatokat, ezért ezeket és a kapcsolódó információkat titokban tartják. Az adatokkal kapcsolatos részletek azonban potenciális szellemi tulajdoni perek forrásai is lehetnek, ami szintén visszatarthatja a vállalatokat attól, hogy túl sokat hozzanak nyilvánosságra.
“Tiszteletben tartjuk a művészek jogait abban, ahogy a kimenetet kezeljük, és vannak olyan szabályaink, amelyek megakadályozzák, hogy bármely élő művész munkáját közvetlenül utánzó képeket generáljunk” – mondta Brad Lightcap, az OpenAI operatív igazgatója.
Az OpenAI kínál egy leiratkozási űrlapot, amely lehetővé teszi az alkotók számára, hogy kérjék műveik eltávolítását a tréningadatkészleteiből. A vállalat azt is állítja, hogy tiszteletben tartja azokat a kéréseket, amelyek megtiltják webes szkennelő botjainak, hogy tréningadatokat – többek között képeket – gyűjtsenek a webhelyekről.
🤔 A közelmúltban komoly aggodalomra adott okot, hogy a GitHubon futó népszerű MI-ügynökök könnyedén kicsalhatják a felhasználók hitelesítő adatait anélkül, hogy erről megfelelő figyelmeztetést kapnának az érintettek...
🔒 Előfordul, hogy a legfrissebb Windows Server 2025 frissítések telepítése után egyes szerverek BitLocker-helyreállítási módba lépnek, és a rendszer a helyreállítási kulcs megadását kéri...
A Windows Task Host nevű rendszerkomponens súlyos sérülékenysége miatt ismét veszélybe kerülhetnek a felhasználók és szervezetek: a sebezhetőség kihasználásával rosszindulatú támadók akár teljes rendszergazdai jogosultságot szerezhetnek a megfertőzött eszközökön...
Az Amerikai Szövetségi Légügyi Hivatal (FAA) hivatalosan is jóváhagyta a drónok elleni nagyenergiájú lézerfegyverek bevetését az Egyesült Államok légterében...
💻 Érdemes megvizsgálni, hogy mennyivel könnyebb és gyorsabb lett a Google Gemini használata Macen: mostantól nem kell böngészőt nyitni, elég letölteni a natív macOS-alkalmazást – így közvetlenül az asztalról indítható a Google MI-chatbotja...
Az Adobe ma új korszakot nyitott a kreativitásban: bemutatta a vadonatúj Firefly MI Assistantot, amely képes egyszerre irányítani a cég összes zászlóshajó-alkalmazását – legyen szó Photoshopról, Premieréről vagy Illustratorról...
A kutatók egyik legnagyobb kihívása az, hogy miként azonosítható az élet idegen bolygókon, amikor a klasszikus jelek, például a biomarkerek vagy bizonyos gázok, más folyamatokból is származhatnak...
Az a miniatűr e-könyv-olvasó, amelyet egy lelkes YouTuber, Paul Lagier fejlesztett ki 3D-nyomtatott házzal és házilag összeállítható elektronikai alkatrészekkel, alig nagyobb egy felnőtt hüvelykujjánál...
Ebből következően érdemes megérteni, hogy a Windows 11 most egy meglepően alap, de annál kényelmesebb funkcióval bővült: egy kicsi, ötletes segédprogrammal, amely leveszi az állandó ablakzsonglőrködés terhét, főleg, ha túl sok program fut egyszerre...
Az elmúlt évben sok rendszergazda szembesült azzal, hogy a Windows Server 2019 vagy 2022 rendszerük egyik napról a másikra, szinte varázsütésre Windows Server 2025-re frissült – ráadásul sokszor anélkül, hogy bárki licencet szerzett volna rá...
💻 Vannak, akik már gyermekkorukban is komoly tehetségről tesznek tanúbizonyságot. Demis Hassabis is közéjük tartozik: hatévesen még csak szülei bátorítását hallgatta, de már ekkor elgondolkodott azon, hogy mit is jelent igazán a legjobbat nyújtani...
Az okosórák és fitnesz-karkötők piaca hatalmas ugrásokon megy keresztül, különösen olyan innovációknak köszönhetően, mint a mesterséges intelligencia, amely a nyers egészségügyi adatokat hasznos tanácsokká alakítja át...
🔬 Izraelben rendkívüli régészeti leletre bukkantak: a Sakhnin-völgyben legalább tíz olyan őskori kőbaltát találtak, amelyeket nem véletlenszerűen, hanem tudatosan, különleges ásványi anyagok, kövületek és geodák felhasználásával készítettek...
💸 A Valve nagy erőkkel dolgozik a Steam Machine piacra dobásán, de miközben a RAM- és tárhelyhiány miatt a konzol-PC bevezetése csúszhat, a cég folyamatosan készíti elő a digitális bolt fontos funkcióit is...
Az élet során végzett, szellemileg megterhelő tevékenységek, mint az olvasás, az írás vagy idegen nyelvek tanulása, jelentősen befolyásolhatják az időskori agy egészségét...
Az Apple alaposan felkavarja az okostelefonos állóvizet: hamarosan bemutatkozhat az első hajlítható iPhone, amely minden előzetes találgatással szemben nem iPhone Fold, hanem iPhone Ultra néven érkezik...
📈 Tipikus eset, amikor a piac izgatottan vár egy kiemelt szint áttörésére, mégsem sikerül: a bitcoin ismét elakadt a 75 000 dolláros (27,2 millió forint) csúcsnál, és lefordult a keddi, közel 76 000 dolláros (27,6 millió forint) kísérlet után; jelenleg 73 900 dollár (26,8 millió forint) körül forog...
Ez a jelenség jól illusztrálható azzal, hogy a legtöbb háztulajdonos azt hiszi, egy biztonsági kamera felszerelésével hátradőlhet, pedig egy rossz helyre helyezett kamera csak dísz a falon...
A vállalatoknak egyre nagyobb kihívást jelent a mesterséges intelligenciára épülő ügynökök bevezetése és működtetése, különösen, amikor ezek összetett irányítási rendszereket igényelnek...
🤖 A Gemini hamarosan túlléphet a hagyományos csevegőfunkción: a legújabb fejlesztésekkel képes lehet komplex munkafolyamatok kezelésére, amelyek eddig csak emberi közreműködést igényeltek...