Az MI végre elfelejtheti a kínos titkait és lopott könyveit

Az MI végre elfelejtheti a kínos titkait és lopott könyveit
Az MI-modellek fejlesztéséhez hatalmas mennyiségű adat szükséges, és a cégek gyakran mindenféle engedélykérés nélkül gyűjtenek be mindent az internetről, beleértve a szerzői jog által védett könyveket is. Ezek a gyakorlatok sorozatos jogi vitákhoz vezettek, ráadásul a szabályozó hatóságok is vizsgálják, hogy az MI-fejlesztők meg tudnak-e felelni például az Európai Általános Adatvédelmi Rendeletben (GDPR) szereplő törlési jogi előírásoknak, vagy a kaliforniai hasonló szabályozásnak. A legegyszerűbb megoldás a kényes vagy jogsértő adatok eltávolítására az lenne, ha ezek nélkül újra képeznék a modelleket, de ez több tízmillió GPU-órányi számítási kapacitást és tetemes költségeket igényelne, így gyakorlatilag kivitelezhetetlen.

Új módszerek a felesleges tudás eltávolítására

A kutatók ezért hatékonyabb módszereken dolgoznak, hogy a modellek képesek legyenek bizonyos információkat elfelejteni vagy „kitörölni” magukból anélkül, hogy újraképzésre lenne szükség. Sok módszer azonban feltételezi, hogy az eredeti tanító adatállomány rendelkezésre áll, ami gyakran nem igaz, hiszen azt a cégek már rég törölték vagy elérhetetlenné tették.

Basak Guler, a Kaliforniai Egyetem docense és csapata egy olyan számításilag hatékony módszert mutatott be, amelyhez nincs szükség az eredeti adathalmazra. Ez a „forrás nélküli elfelejtés” koncepciója: egy helyettesítő adatkészletet és egy úgynevezett Newton-frissítést használnak a modell módosításához, majd rejtett, véletlenszerű zajjal biztosítják, hogy a törölni kívánt adatok valóban eltűnjenek.

A végeredmény: gyorsabb tisztítás, kevesebb energia

Kísérleteik során az új eljárás a teljes újratanítással összevethető eredményt hozott, miközben jóval kevesebb számítási erőforrást igényelt. Ez nagy előrelépést jelent a magán- vagy szerzői jog által védett adatok gyors és hatékony törlésére irányuló törekvésekben.

Egyelőre a módszer főként egyszerűbb MI-modelleken működik, a hatalmas, népszerű csevegőrobotokat működtető nyelvi modellek (LLM-ek) esetében további kutatásra van szükség. Guler szerint még rengeteg a nyitott kérdés – például hogy hogyan építsük fel a helyettesítő adatkészletet –, de ez az első lépés a jogszerű és etikus MI-fejlesztés útján.

2025, adrienne, go.theregister.com alapján

  • Te szerinted mennyire etikus, ha egy cég engedély nélkül használ fel adatokat MI-fejlesztéshez?
  • Te mit tennél, ha rájönnél, hogy a saját műved is benne van egy MI modellben engedély nélkül?



Legfrissebb posztok

Az uniós kötvénypiac remeg, jön a francia bizalmi válság

MA 23:51

Az uniós kötvénypiac remeg, jön a francia bizalmi válság

📈 Európa pénzpiacait heves hullámzás jellemzi, és a következő napokban is folytatódhat a vad kötvényármozgás. Míg a sajtó szívesen foglalkozik óriáscégek vezetőinek botrányaival, a befektetőket most inkább az európai...

A szmog ronthatja az Alzheimer-kórt: nem csak a memória illan el

MA 22:51

A szmog ronthatja az Alzheimer-kórt: nem csak a memória illan el

Azoknál, akik magas légszennyezettségű területen élnek, fokozott mértékben rakódnak le az Alzheimer-kóros agyban a toxikus amiloid- és taufehérjék, ami gyorsíthatja a szellemi hanyatlást és az önellátás elvesztését. Már...

Az új Pfizer-oltás négyszeres immunválaszt ad, de kevesen jutnak hozzá

MA 22:01

Az új Pfizer-oltás négyszeres immunválaszt ad, de kevesen jutnak hozzá

💉 A Pfizer és a BioNTech legfrissebb vizsgálata szerint az idei COVID-oltás jelentősen, legalább négyszeresére emelte a semlegesítő antitestek szintjét időseknél és krónikus betegségekben szenvedőknél. Ezek az eredmények akkor...

Az univerzum rejtelmei, a kemény hobbi izgalmai

MA 21:51

Az univerzum rejtelmei, a kemény hobbi izgalmai

💫 Érdemes kiemelni, hogy a legújabb tudományos kutatások egészen meghökkentő kérdéseket vetnek fel. A világ jelenleg ismert legősibb emberi maradványait például Görögországban, 1960-ban fedezték fel, korukat legalább 286 000...

A galaxisok bölcsője: új csillagszületési komplexumot talált a JWST

MA 21:26

A galaxisok bölcsője: új csillagszületési komplexumot talált a JWST

🚀 Egy olasz kutatócsoport a James Webb-űrtávcső (JWST) segítségével felfedezett egy apró, halvány csillagszületési komplexumot, amely a korai Univerzum állapotaira emlékeztet. Az LAP2 nevű objektum a galaxishalmaz, az Abell...

A YouTube végre mindenkit leszinkronizál

MA 21:01

A YouTube végre mindenkit leszinkronizál

A YouTube új, többnyelvű hang- és szinkronizálási lehetősége mostantól minden tartalomkészítő számára elérhető. Eddig csak néhány kiemelt csatorna – például a MrBeast, Mark Rober vagy Jamie Oliver –...

Az Apple megnyugodhat, egyelőre marad a Google a keresőjükben

MA 20:52

Az Apple megnyugodhat, egyelőre marad a Google a keresőjükben

😊 Egy amerikai szövetségi bíró döntése után az Apple részvényei több mint 3%-kal erősödtek a tőzsdezárás utáni kereskedésben. A bíró engedélyezte, hogy a Google továbbra is fizethessen az Apple-nek...

Az emelkedő tengerszint egymillió ausztrál otthonát veszélyezteti

MA 20:02

Az emelkedő tengerszint egymillió ausztrál otthonát veszélyezteti

🌊 A klímaváltozás miatt emelkedő tengerszint és a gyakoribb áradások 2050-ig mintegy 1,5 millió ausztrál otthonát és megélhetését sodorhatják veszélybe, miközben a hőség okozta halálesetek száma drámaian növekedhet. A...

Az MI már emlékszik minden szavadra – de tényleg akarod?

MA 19:51

Az MI már emlékszik minden szavadra – de tényleg akarod?

Az Anthropic által fejlesztett Claude MI mostantól automatikusan képes megjegyezni a korábbi beszélgetéseket, egyelőre csak a Team és Enterprise előfizetők számára. Claude így önállóan figyelembe veszi a felhasználó...