Nézd meg, mire képesek a mesterséges intelligencia háttéreltávolító modelljei, meg fogsz lepődni

Nézd meg, mire képesek a mesterséges intelligencia háttéreltávolító modelljei, meg fogsz lepődni
Az MI-fejlesztések hihetetlen sebességgel változtatják meg azt, ahogyan képeket feldolgozunk, válogatunk vagy szerkesztünk. Néhány éve még elképzelhetetlen lett volna, hogy valós időben, különleges hardver és bonyolult telepítés nélkül eltávolíthatjuk a háttért a fotókról. Ma már akár az utolsó pizsamás szelfiden is szinte varázsütésre tűnik el a zavaró háttér – mindezt egyetlen MI-modell segítségével.

Mi is az az MI-alapú képszegmentáció?

Az MI-alapú képszegmentáció lényege, hogy a kép minden egyes pixeléről eldönti, melyik kategóriába tartozik: például előtér (ami minket érdekel), vagy háttér (amit ki akarunk takarni, átszínezni, eltüntetni). Ez eltér a hagyományos objektumfelismeréstől, amely csak egy körülhatároló keretet rajzol például egy arc vagy kutya köré, de nem mondja meg, pontosan melyik pixel tartozik az adott objektumhoz.

A kiemelten fontos képrészlet – a szaknyelvben ezt hívják szaliencia detektálásnak – egy bináris maszkon keresztül jelenik meg: ahol a kép igazán lényeges (például a főszereplő), ott magas értéket (255), a háttérben alacsonyat (0) kapnak a pixelek. Nem hagyható figyelmen kívül, hogy néhány alkalmazás összetettebb – lehet többféle előtér-kategória is, például egy kutya vagy egy szék –, ilyen az úgynevezett többosztályos maszkolás.

A mindennapi életben ez lehetővé teszi, hogy egy webáruház egyszerű, fehér háttérre illessze a termékeket, vagy hogy a felhasználók kreatívan kivághassák magukat egy mémhez.

Kiemelkedő modellek a háttéreltávolításban

Négy, jelenleg csúcskategóriás modellt teszteltek:

– U2-Net: Több mint 21 ezer képet tartalmazó adathalmazon tanult, több szintű képelemzést végez.
– IS-Net: Az U2-Net továbbfejlesztett változata, kétlépcsős feldolgozással: előbb durva maszkolás, majd a határvonalak finomítása.
– BiRefNet: Kétirányú, többszörös precíziós áttekintéssel ellenőrzi magát, hogy a részletek és az egész kép összhangban legyenek.
– SAM (Segment Anything Model): A Meta által fejlesztett, általános célú modell, amely akár több kategóriát is képes leválasztani egy képről.

Az U2-Net és az IS-Net hasonló metódussal, de eltérő megközelítéssel dolgozik. A BiRefNet először a fontos régiókat körvonalazza, majd egy második körben az apró részleteket is kidolgozza, végül ellenőrzi, hogy a részletek illeszkednek-e az egész képhez. A SAM modelltől eltérően, amely más típusú felhasználásra erősebb, mivel működéséhez némi előzetes instrukció szükséges.

Mennyire pontosak ezek a modellek?

A pontosságot elismert mutatókkal mérik:

– Intersection over Union (IoU): Megnézi, mekkora az átfedés a becsült és a valós előtér pixelek között. 1 a tökéletes egyezés, 0 a teljes eltérés.
– Dice-köeficiens: Hasonló, de valamivel megengedőbb az IoU-nál, inkább az átfedést jutalmazza.
– Pixelpontosság: A helyesen azonosított pixelek aránya a teljes képhez viszonyítva – viszont nagy háttér esetén elfedheti a hibákat.

Ezért leginkább az IoU-t és a Dice-köeficienst vették alapul, mert a pixelpontosság félrevezető lehet: akár egy csak a háttérre koncentráló modell is kiugró pontszámot érhet el ezen a mutatón, még ha az előtér felismerése hiányos is.


Gyorsaság és pontosság kéz a kézben?

A méréshez kétféle GPU-t használtak: egy 23 GB-osat (átlagos fogyasztói hardver), illetve egy 94 GB-osat (nagy MI-műveletekhez). A kisebb GPU-n a könnyű modellek bizonyultak a leggyorsabbnak: az U2-Net (176 MB) és az IS-Net (179 MB) rendre 307 és 351 milliszekundumos átlagos feldolgozási időt értek el. A nagyobb, bonyolultabb BiRefNet (973 MB) csak 821 milliszekundum alatt végzett, de a nagyobb GPU-n már utolérte a többi modellt.

Fontos, hogy a tesztekhez két adathalmazt használtak: egy “Humans” (Emberek, 7000 kép) és egy vegyes, komplexebb (DIS5K) készletet. A modellek pontosság és sebesség terén is jobban teljesítettek az egyszerűbb, embereket ábrázoló képekkel. A bonyolultabb, zsúfolt képeken (DIS5K) gyakoribbak voltak a hibák, és a feldolgozás is lassabb lett.

A specializált modellek kissé pontosabbak, de a mindennapi gyakorlatban egy univerzális, gyors modell előnyösebb. A SAM modell viszont automatikus, “prompt nélküli” feladatoknál túl lassúnak és kevésbé pontosnak bizonyult.

A BiRefNet minden változatával az élmezőnyhöz tartozott, átlagosan 0,87-es IoU és 0,92-es Dice-köeficiens értéket ért el, míg a fókuszált U2-Net az “emberek” készleten kiemelkedő (IoU 0,89; Dice 0,94), viszont a vegyes képeken gyenge (IoU 0,39; Dice 0,52) eredményt produkált.

Tipikus hibák: mi okoz nehézséget a gyakorlatban?

A modellek gyakran az apró részletek felismerésében (például egy kerék küllői), vagy éppen a lényeg kiemelésében hibáznak. Előfordult, hogy az U2-Net vagy az IS-Net a póló logóját kiemelte, de magát a pólót már nem. A BiRefNet viszont minden esetben jól felismerte az objektum egészét, mivel folyamatosan összeveti a globális és lokális információkat.

Így használható az automata háttéreltávolítás

A Cloudflare Images API már támogatja a képek automatikus háttéréltávolítását, akár tárhelyen, akár máshol tárolt fotókról legyen szó. A segment paraméterrel nemcsak az előtér emelhető ki: a háttér átlátszóvá is tehető, vagy kitölthető fehérrel. Egy adott URL-en keresztül például lekérhető egy arcra fókuszált, háttér nélküli kép, ahol a transzparens területeket fehér (#FFFFFF) szín váltja fel; mindez nagyjából 1100–1150 forintos MI-munka költségével.

Az Images API akár programozott munkafolyamatokba is integrálható: például egy egyszerű képszerkesztőben különböző képeket rétegezhetünk egymásra, a kivágott elemeket pedig használhatjuk mémekhez, matricákhoz.

A háttéréltávolítás funkció újabb lépést jelent az interaktív, kreatív MI-eszközök fejlesztésében, és minden jel arra mutat, hogy a jövőben még kifinomultabb, gyorsabb és pontosabb megoldások várhatóak – egyre egyszerűbb használattal.

2025, adminboss, blog.cloudflare.com alapján

  • Te szerinted jó ötlet, ha az MI automatikusan eldönti, mi a lényeges egy képen?
  • Te bízol abban, hogy mindig helyesen működik egy ilyen háttéreltávolító?
  • Ha hibásan maszkírozna le egy képet, te javítanád kézzel vagy rábíznád újra az MI-re?


Legfrissebb posztok

MA 17:01

Az USA 2030-ra atomreaktort küldene a Holdra

Új lendületet vehet az űrkutatás, ugyanis a NASA és az USA Energiaügyi Minisztériuma közösen fejlesztik a Hold felszínére szánt atomreaktort, hogy folyamatos, megbízható áramforrást biztosítsanak a majdani holdbázisoknak és tudományos misszióknak...

MA 16:51

Az ember visszatér a Holdra: közeleg az első Artemis-küldetés

🚀 Az Artemis 2 misszió előkészületei utolsó fázisukba érkeztek, a NASA pedig akár már ezen a hétvégén megkezdheti a hatalmas SLS rakéta és az Orion űrkapszula kigördítését a floridai Kennedy Űrközpont kilövőállásához...

MA 16:34

A kötelező életkor-ellenőrzés térdre kényszerítette a Robloxot

A Roblox múlt héten kötelezővé tette az életkor-ellenőrzést minden chatelő számára...

MA 16:01

Váratlanul megjött az Állatátkelő: Új horizontok 3.0-s frissítés

Meglepetés érte a rajongókat: az Állatátkelő: Új horizontok (Animal Crossing: New Horizons) 3...

MA 15:33

Az önvezetés ára: előfizetésre vált a Tesla nagy dobása

A Tesla teljes önvezető (Full Self-Driving, FSD) rendszerét február 14-e után már csak havi előfizetéssel lehet igénybe venni, egyszeri, 2,9 millió forintos (8 000 USD) díj helyett...

MA 15:19

Az 5 fitneszapp, ami 2026-ban tényleg lendületben tart

Az új év mindig remek lehetőség arra, hogy újra nekifuss az egészséges életmódnak – de a kitartás általában februárra vagy márciusra alábbhagy...

MA 15:01

Az új Galaxy S26 véget vethet az időpontütközéseknek

A Samsung Galaxy S26 új MI-funkcióval bővülhet, amely figyelmeztet, ha véletlenül ugyanarra az időpontra szervezel két találkozót...

MA 14:49

Az önvezető taxiknak zöld út New Yorkban – kivéve a várost

🚕 Kathy Hochul, New York állam kormányzója bejelentette, hogy hamarosan olyan jogszabály-tervezetet nyújt be, amely állami szinten legálissá teszi az önvezető taxik (robotaxik) használatát – egyetlen kivétellel: New York városában továbbra is tilosak maradnának...

MA 14:33

A lebénult oktatási minisztérium: diákadatok a hackerek kezén

🔒 A Viktória állam Oktatási Minisztériuma súlyos adatlopási incidens nyomán értesítette a szülőket: ismeretlen támadók hozzáfértek egy adatbázishoz, amely jelenlegi és egykori diákok nevét, iskoláit, évfolyamait, valamint az iskola által kiadott e-mail-címeket és titkosított jelszavakat tartalmazott...

MA 14:17

A legújabb Windows 365-frissítés megint használhatatlanná teszi a Cloud PC-t

💥 A legutóbbi Windows 365-frissítés óta rengeteg felhasználó nem tud hozzáférni Microsoft 365-ös Cloud PC-jéhez...

MA 14:01

Az esők nem segítenek: egyre súlyosabb aszály vár ránk

🌧 Ahogy a Föld melegszik, Nyugat-Európában és Észak-Amerika nyugati részén egyre gyakoribbá és súlyosabbá válnak a mezőgazdasági aszályok – még akkor is, ha az éves csapadékmennyiség növekszik...

MA 13:49

A maine-i adatbotrány: 145 ezer ember egészségügyi adata veszélyben

Tavaly súlyos adatvédelmi incidens rázta meg a Central Maine Healthcare (CMH) rendszerét, amely több mint 145 ezer ember érzékeny adatait tette ki a támadóknak...

MA 13:33

A Meta bezárta három VR-stúdióját: vége egy újabb metaverzum-álomnak

💀 A Meta jelentős leépítéssel válaszolt a metaverzum üzletág problémáira, bezárva az Armature, a Sanzaru és a Twisted Pixel nevű VR stúdiókat...

MA 13:17

A bélflóra háborúja az erszényesekben: mikrobák a gyógyszerek ellen

🤿 A legújabb, 23 erszényes fajra kiterjedő kutatás jelentős újdonságokat hozott az őshonos ausztrál állatok bélrendszerének mikrobáiról...

MA 12:50

A jelszavaknál tényleg a méret számít?

Évek óta halljuk, hogy a hosszabb jelszó biztonságosabb. Rakj bele minél több karaktert, legyenek benne számok, szimbólumok, kis- és nagybetűk, és akkor már nagy gond nem lesz...

MA 12:34

Itt az Ammobia áttörése: olcsóbb, zöldebb műtrágya jön

🌱 Érdekes felvetés, hogy az ammónia, a világ egyik legfontosabb vegyszere, mindeddig kevés figyelmet kapott, pedig nélküle a mezőgazdaság gyakorlatilag működésképtelen lenne...

MA 12:01

Az amerikai bitcoin ETF-ek ismét rekordközelben száguldanak

📈 Az amerikai spot bitcoin ETF-ek három hónap óta a legerősebb napjukat zárták, 276 milliárd forint (750 millió dollár) friss tőke áramlott hozzájuk kedden...

MA 11:50

Az offshore szél nagy dobása: olcsóbb áram, vagy újabb viták?

🌀 A brit kormány történelmi mennyiségű új offshore szélerőmű-projektre adott ki szerződéseket, ezzel meghatározó lépést téve a tiszta energia irányába...

MA 11:34

Az olcsó Ubiquiti átjáró nagyító alatt: UXG‑Lite teszt

Az Ubiquiti UXG-Lite egy meglepően kompakt és energiatakarékos hálózati eszköz, amely ideális belépő az Ubiquiti ökoszisztémájába...