Az MI végre elfelejtheti a kínos titkait és lopott könyveit

Az MI végre elfelejtheti a kínos titkait és lopott könyveit
Az MI-modellek fejlesztéséhez hatalmas mennyiségű adat szükséges, és a cégek gyakran mindenféle engedélykérés nélkül gyűjtenek be mindent az internetről, beleértve a szerzői jog által védett könyveket is. Ezek a gyakorlatok sorozatos jogi vitákhoz vezettek, ráadásul a szabályozó hatóságok is vizsgálják, hogy az MI-fejlesztők meg tudnak-e felelni például az Európai Általános Adatvédelmi Rendeletben (GDPR) szereplő törlési jogi előírásoknak, vagy a kaliforniai hasonló szabályozásnak. A legegyszerűbb megoldás a kényes vagy jogsértő adatok eltávolítására az lenne, ha ezek nélkül újra képeznék a modelleket, de ez több tízmillió GPU-órányi számítási kapacitást és tetemes költségeket igényelne, így gyakorlatilag kivitelezhetetlen.

Új módszerek a felesleges tudás eltávolítására

A kutatók ezért hatékonyabb módszereken dolgoznak, hogy a modellek képesek legyenek bizonyos információkat elfelejteni vagy „kitörölni” magukból anélkül, hogy újraképzésre lenne szükség. Sok módszer azonban feltételezi, hogy az eredeti tanító adatállomány rendelkezésre áll, ami gyakran nem igaz, hiszen azt a cégek már rég törölték vagy elérhetetlenné tették.

Basak Guler, a Kaliforniai Egyetem docense és csapata egy olyan számításilag hatékony módszert mutatott be, amelyhez nincs szükség az eredeti adathalmazra. Ez a „forrás nélküli elfelejtés” koncepciója: egy helyettesítő adatkészletet és egy úgynevezett Newton-frissítést használnak a modell módosításához, majd rejtett, véletlenszerű zajjal biztosítják, hogy a törölni kívánt adatok valóban eltűnjenek.

A végeredmény: gyorsabb tisztítás, kevesebb energia

Kísérleteik során az új eljárás a teljes újratanítással összevethető eredményt hozott, miközben jóval kevesebb számítási erőforrást igényelt. Ez nagy előrelépést jelent a magán- vagy szerzői jog által védett adatok gyors és hatékony törlésére irányuló törekvésekben.

Egyelőre a módszer főként egyszerűbb MI-modelleken működik, a hatalmas, népszerű csevegőrobotokat működtető nyelvi modellek (LLM-ek) esetében további kutatásra van szükség. Guler szerint még rengeteg a nyitott kérdés – például hogy hogyan építsük fel a helyettesítő adatkészletet –, de ez az első lépés a jogszerű és etikus MI-fejlesztés útján.

2025, adrienne, go.theregister.com alapján

  • Te szerinted mennyire etikus, ha egy cég engedély nélkül használ fel adatokat MI-fejlesztéshez?
  • Te mit tennél, ha rájönnél, hogy a saját műved is benne van egy MI modellben engedély nélkül?



Legfrissebb posztok

MA 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...



MA 16:46

Ismét lassul a növekedés, megtorpantak a kínai gyárak

📈 Kínában októberben ismét lassult a gyárak teljesítménye, az exportmegrendelések pedig a leggyorsabb ütemben estek vissza május óta...

MA 16:37

Az MI újabb átverése: Kamu Nvidia-bemutató szedte áldozatait

Majdnem 100 ezer ember nézte végig, ahogy egy hamis, MI által megalkotott Jensen Huang prezentált egy Nvidia GTC főelőadást, amely valójában kriptovaluta-átverés volt...



MA 16:29

Tényleg erre vágyunk, hogy minden kütyüben MI legyen?

Kevin Rose egyszerű, de annál szemléletesebb szűrőt használ, amikor MI-hardverekbe fektet: ha valakit legszívesebben orrba vágnál azért, mert valamilyen kütyüt visel, inkább kerüld el azt a terméket – és jobb, ha nem ölsz pénzt ilyen fejlesztésbe sem...



MA 16:18

Az apró elektromotor, amely négy Teslát is lepipál

A brit YASA egy új, elképesztően kicsi elektromotort alkotott, amely teljesítményével bőven túlszárnyalja a jelenlegi rekorder motorokat...



MA 16:10

Az MI-chatbotok új generációjával mindenhol ott lehetsz

Az MI-alapú chatbotok forradalma elhozta azt a pillanatot, amikor bárki könnyedén létrehozhat saját, testreszabott virtuális asszisztenst, amely mindenhol bevethető – legyen szó weboldalról, közösségi platformokról vagy vállalati csapatmunkáról...

MA 16:00

Az Amazon elektromos furgonjai végre Kanadában is feltűntek

Az Amazon most először vetette be a Rivian által gyártott elektromos kiszállító furgonokat Kanadában: a Vancouver környékén már 50 ilyen jármű dolgozik...

MA 15:56

Az MI-vel készült zene tényleg olyan, mint az emberi?

🎵 Az MI által készített zene egyre közelebb áll ahhoz, hogy megkülönböztesse magát az emberi alkotástól – legalábbis, ami a hangzást illeti...



MA 15:46

Az MI bakija: Kamuhírekkel kevert szenátorbotrány a Google-nél

A Google kénytelen volt eltávolítani Gemma nevű MI-modelljét az AI Studio platformról, miután Marsha Blackburn amerikai szenátor panaszt tett: a rendszer hamis és súlyos vádakkal illette őt...



MA 15:37

Az 1 petabájtos SSD-k útja: a Meta új tárhelyvíziója

💾 A Meta új korszakot nyitna az adattárolásban és a GPU-kiszolgáló-infrastruktúrában, amikor 1 PB (1024 TB) kapacitású, E2 formátumú SSD-ket vezetne be...



MA 15:28

Az Nvidia óriási pénzzel dobja meg a Poolside-ot

Az Nvidia akár 360 milliárd forinttal is beszállhat a mesterséges intelligenciával foglalkozó Poolside nevű startupba...



MA 15:20

Amikor az állatvilág trükkösen félrevezeti az érzékelést

👀 Az optikai illúziók nem csupán az emberek kiváltsága: számos állat is észleli, sőt, ki is használja őket...

MA 14:46

Egy új vérteszt végre igazolja a krónikus fáradtság szindrómát

Tudósok a University of East Anglia és az Oxford BioDynamics közreműködésével olyan vértesztet fejlesztettek ki, amely 96 százalékos pontossággal képes kimutatni a krónikus fáradtság szindrómát (Myalgic Encephalomyelitis, ME/CFS)...

MA 14:38

A nagyvállalatok profitja már nem függ a dolgozók számától

📈 A technológiai szektorban drámai átalakulás zajlott le az elmúlt évtizedekben: már nem igaz, hogy a bevételnövekedéshez arányosan több dolgozóra van szükség...



MA 14:29

Új aranyláz, őrült roham a ritkaföldfémekért

Lényeges szempont, hogy a világgazdaság újabb nagy átalakuláson megy keresztül. Most nem az arany, nem az olaj, hanem a ritkaföldfémek pörgetik az árfolyamokat, és a befektetők szemében ezek értéke soha nem látott magasságokba emelkedik...



MA 14:19

Miért lassulhat az internet, a CGNAT mindannyiunkat érinti

📡 Ahogy rohamosan fogynak az IPv4-címek a világban, a szolgáltatók forradalmi, de nem problémamentes megoldáshoz fordultak: egyesek már több száz, vagy akár ezer felhasználót tesznek egyetlen IP-cím mögé a Carrier-Grade NAT (CGNAT) technológiával...



MA 14:03

Az Aqara G100 mindent tudó, olcsó biztonsági kamera

📺 A biztonsági kamerák piaca egyre zsúfoltabb, de kevés olyan eszköz akad, amely egyszerre ennyire megfizethető és sokoldalú, mint az Aqara legújabb modellje, a G100...

MA 13:46

Megjött az év legnagyobb Kickstarter-sikere: itt a Snapmaker U1

🚀 A Snapmaker végre bemutatta régóta várt U1 3D nyomtatóját, amely rekordot döntött a Kickstarteren: több mint 20 000 támogatóval közel 7,3 milliárd forintnyi előrendelést gyűjtött...

MA 13:28

Az önvezető taxik harca: a Baidu utolérte a Waymót

A Baidu Apollo Go szolgáltatása heti 250 ezer önvezető robotaxi-fuvart teljesít Kínában, így mostanra beérte az Alphabet Waymóját (Waymo), amely tavasszal szintén ekkora forgalmat jelentett be az Egyesült Államokban...