Az MI végre elfelejtheti a kínos titkait és lopott könyveit

Az MI végre elfelejtheti a kínos titkait és lopott könyveit
Az MI-modellek fejlesztéséhez hatalmas mennyiségű adat szükséges, és a cégek gyakran mindenféle engedélykérés nélkül gyűjtenek be mindent az internetről, beleértve a szerzői jog által védett könyveket is. Ezek a gyakorlatok sorozatos jogi vitákhoz vezettek, ráadásul a szabályozó hatóságok is vizsgálják, hogy az MI-fejlesztők meg tudnak-e felelni például az Európai Általános Adatvédelmi Rendeletben (GDPR) szereplő törlési jogi előírásoknak, vagy a kaliforniai hasonló szabályozásnak. A legegyszerűbb megoldás a kényes vagy jogsértő adatok eltávolítására az lenne, ha ezek nélkül újra képeznék a modelleket, de ez több tízmillió GPU-órányi számítási kapacitást és tetemes költségeket igényelne, így gyakorlatilag kivitelezhetetlen.

Új módszerek a felesleges tudás eltávolítására

A kutatók ezért hatékonyabb módszereken dolgoznak, hogy a modellek képesek legyenek bizonyos információkat elfelejteni vagy „kitörölni” magukból anélkül, hogy újraképzésre lenne szükség. Sok módszer azonban feltételezi, hogy az eredeti tanító adatállomány rendelkezésre áll, ami gyakran nem igaz, hiszen azt a cégek már rég törölték vagy elérhetetlenné tették.

Basak Guler, a Kaliforniai Egyetem docense és csapata egy olyan számításilag hatékony módszert mutatott be, amelyhez nincs szükség az eredeti adathalmazra. Ez a „forrás nélküli elfelejtés” koncepciója: egy helyettesítő adatkészletet és egy úgynevezett Newton-frissítést használnak a modell módosításához, majd rejtett, véletlenszerű zajjal biztosítják, hogy a törölni kívánt adatok valóban eltűnjenek.

A végeredmény: gyorsabb tisztítás, kevesebb energia

Kísérleteik során az új eljárás a teljes újratanítással összevethető eredményt hozott, miközben jóval kevesebb számítási erőforrást igényelt. Ez nagy előrelépést jelent a magán- vagy szerzői jog által védett adatok gyors és hatékony törlésére irányuló törekvésekben.

Egyelőre a módszer főként egyszerűbb MI-modelleken működik, a hatalmas, népszerű csevegőrobotokat működtető nyelvi modellek (LLM-ek) esetében további kutatásra van szükség. Guler szerint még rengeteg a nyitott kérdés – például hogy hogyan építsük fel a helyettesítő adatkészletet –, de ez az első lépés a jogszerű és etikus MI-fejlesztés útján.

2025, adrienne, go.theregister.com alapján

  • Te szerinted mennyire etikus, ha egy cég engedély nélkül használ fel adatokat MI-fejlesztéshez?
  • Te mit tennél, ha rájönnél, hogy a saját műved is benne van egy MI modellben engedély nélkül?



Legfrissebb posztok

MA 09:54

Az okosotthonok bukása: egyre többen kapcsolnak vissza analógra

A legújabb lakberendezési trend szerint egyre többen szabadulnak meg az okosotthonoktól, és térnek vissza az egyszerű, analóg berendezésekhez...



MA 09:50

Dél-Afrikában bukkantak rá az első fenékhúzásos ősleletre

Délnyugat-Afrika tengerpartján, a Fokföld régióban egyedülálló őslénytani felfedezést tettek: a világ első fosszilis „fenékhúzásos” nyomát azonosították, amelyet egy szőrös, elefánthoz távolról hasonlító rokon, a sziklanyúl (dassie) hagyott hátra – 126 000 évvel ezelőttről...



MA 09:43

Az igazi T. rex unokatestvér a porondon: új dínó vagy csak tini?

🐅 Egy Montana államban kiásott teljes dinoszaurusz-csontváz ismét felkavarja a szakértők kedélyeit: vajon egy fiatal T...



MA 09:37

Az európai természetvédelem sorsát az agráripar dönti el

Az európai Natura 2000 védett területek jövője szorosan összefügg a mezőgazdasági gyakorlatokkal...

MA 09:25

Az MI is tud rágalmazni? A Google nagy dilemmája

A Google kénytelen volt eltávolítani a Gemma nevű MI-modelljét az AI Studio platformjáról, miután Marsha Blackburn, Tennessee republikánus szenátora súlyos vádakkal illette a rendszert...

MA 09:20

Első lépések a gyerekek testi biztonságának megtanításához

🔒 Az elmúlt hetekben ismét rengeteg családot rázott meg a hír: csaknem 150, kisgyermekekkel foglalkozó dolgozót vádoltak vagy ítéltek el szexuális visszaélés, illetve helytelen viselkedés miatt...



MA 09:02

Az okos otthon helyett digitális hirdetőtáblák vesznek minket körül

Az elmúlt évtizedekben a technológiai óriáscégek azt ígérték, hogy digitális életünk kiszabadul a monitorok és telefonok világából, és átszövi majd az egész környezetünket: konyhai kijelzők, hűtőszekrények, autóműszerfalak, okostévék lesznek mindenhol...



MA 08:56

Az MI nem gondolkodik helyettünk, de kié a felelősség

🤔 A legújabb, egyre kifinomultabb MI-modellek elképesztő gyorsasággal és pontossággal írnak szövegeket, egyre kevesebb hibával vagy valótlansággal...



MA 08:25

Óriási meglepetés, a kanári-szigeteki pók megfelezi a genetikai állományát

🔬 A Kanári-szigeteken élő Dysdera tilosensis nevű pókfaj valóságos evolúciós rejtélyt szolgáltatott a tudósoknak: mindössze néhány millió év alatt mintegy felére csökkent a genomjának mérete, miközben genetikai sokfélesége mégis meghaladja a kontinensen élő rokonfajokét...



MA 08:06

Az OpenAI túl nagy lett, hogy elbukjon?

Az OpenAI hatalmas reményeket keltett az MI jövőjét illetően, de még nem termelt nyereséget, miközben éves bevétele csupán az Amazon forgalmának mintegy 2 százaléka...



MA 07:55

A túl nagy aláírás önimádatot jelez?

🖌 Donald Trump hatalmas, feltűnő aláírása régóta borzolja a kedélyeket, és tökéletesen illeszkedik önimádatáról híres múltjához...

MA 07:31

Az internet tényleg ennyire törékeny? Megdöbbentő Cloudflare-jelentés

📶 Július és szeptember között több mint 125 országban voltak kisebb-nagyobb internetkimaradások, a háttérben pedig sokszor egészen hétköznapi vagy éppen aggasztó okok álltak...



MA 07:25

Az igazságügy új csodafegyvere: ujjlenyomat a kilőtt töltényhüvelyen

🔍 Két ír kutató forradalmi eljárást dolgozott ki, amellyel sikerült ujjlenyomatot visszanyerni akár kilőtt töltényhüvelyről is – amit eddig szinte lehetetlennek tartottak...

MA 07:19

Az első kínai víz alatti adatközpont lenyomja a Microsoftot

A Sanghaj melletti Lin-gang különleges gazdasági övezetben felépítették a világ első, teljesen kereskedelmi víz alatti adatközpontját...

MA 07:13

A Penn Egyetemet ért brutális adatszivárgás: 1,2 millió donor adatai kerültek ki

A Pennsylvaniai Egyetem (University of Pennsylvania) múlt heti „meghackeltek minket” figyelmeztetése után robbant a hír: egy betörőcsoport szerint sokkal nagyobb mértékű adatlopás történt, mint amit az egyetem elismert...



APP
MA 07:13

APPok, Amik Ingyenesek MA, 11/3

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Hours Clocker (iPhone/iPad)A Hours Tracker egy sokoldalú alkalmazás, amely megkönnyíti a munkaórák rögzítését, a kereset kiszámítását és a munkabeosztás áttekintését...



vasárnap 19:46

Miért nem számítanak a fogak csontnak, itt az igazság

🙂 A fogak és a csontok első ránézésre nagyon hasonlítanak: kemények, fehérek, tele vannak kalciummal...



vasárnap 19:36

Az intersztelláris üstökös, amely kívülről érkezett hozzánk

🪐 A James Webb-űrteleszkóp először készített felvételt a 3I/ATLAS nevű üstökösről, amely körül óriási szén-dioxid-felhőt észleltek...

vasárnap 19:28

Az egész Karib-térség gyászol: 50 halott Melissa hurrikánja után

😪 A Karib-térségre lecsapó Melissa hurrikán következtében eddig legalább 50-en haltak meg, és a mentőalakulatok még magasabb számokra számítanak...