
Nem minden, ami adatalapú, objektív
Sokan hiszik, hogy a számítógépes látásmodellek teljesen objektívek, mert adatok és algoritmusok működnek bennük. Ezzel szemben a valóság az, hogy a modellek ugyanazokat az elfogultságokat hordozzák, amelyek a tanító adatokban is jelen vannak. A rendszer például gyakran női orvosokat ápolónak minősít, vagy összemossa a családtagokat egy arcfelismerő rutinnál, ahogyan ezt egyes kínai okostelefonos jelenetekből ismerjük.
Az FHIBE újdonsága: hozzájáruláson alapuló, globálisan sokszínű adatbázis
A Sony MI által most közzétett FHIBE-adatbázis több mint 10 000, hozzájáruláson alapuló képet gyűjt össze 1 981 emberről, 81 országot átfogva. Ezekhez a képekhez részletes adatok (például pontos kijelölések, kamerabeállítások) is társulnak, ami hosszú távon pontosabbá teszi az elfogultság mérését. Fontos megjegyezni, hogy a korábbi adatbázisok képeit legtöbbször engedély nélkül gyűjtötték, ráadásul sokszor nem volt világos, pontosan milyen hozzájárulást adtak ehhez a képen szereplő személyek. Az FHIBE ezzel a gyakorlattal szakít, és a transzparencia, valamint a kompenzáció elvét is szem előtt tartja.
Az elfogultság konkrét példái
A kutatók az FHIBE használatával kimutatták, hogy egyes MI-rendszerek figyelembe sem veszik a nemi identitást; például a nőies névmások és a hajstílusok változatossága miatt könnyebben tévesztenek. Más modellek pedig sztereotípiákat erősítenek fel: ha valaki foglalkozásáról kérdezünk, gyakran olyan választ adnak, amelyben egy adott demográfiai csoportot tévesen bűnözőkkel azonosítanak.
Etikus adatgyűjtés: merre tovább?
Jelenleg az USA-ban kevés szövetségi szabályozás támogatja az MI etikus használatát. Az Európai Unió új MI-szabályozása és néhány amerikai állam törvénye viszont már előírja a rendszeres elfogultságellenőrzést bizonyos kockázatos területeken. A Sony saját üzleti egységei az FHIBE segítségével auditálják MI-rendszereiket, összhangban a cég MI-etikai irányelveivel. Az FHIBE nemcsak az elfogultság ellenőrzésében segít, hanem példát mutat arra, hogy az etikus adatgyűjtés, a beleegyezés és a kompenzáció igenis megvalósítható gyakorlat lehet.
Mi várható az iparágban a jövőben?
Ennek fényében elmondható: az FHIBE kicsi, de fontos adatbázis, amely új sztenderdet állíthat fel az MI-fejlesztés innovációjában. A Sony kutatói szerint a cégek többsége eddig azt hitte, hogy kiváló MI-hez csak engedély nélkül gyűjtött adatok szükségesek, de az FHIBE megmutatja, hogy a beleegyezésen alapuló adatgyűjtés mellett sem kell kompromisszumot kötni a minőség terén. Ezzel szemben a nagy iparági fókusz még mindig az algoritmusokra irányul, de etikus adatgyűjtés nélkül az MI-technológia nem lehet igazán megbízható és igazságos.
