2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

csütörtök 21:35

Az új DeFi-botrány tovább tépázza az intézményi bizalmat

A decentralizált pénzügyi rendszereket (DeFi) újabb hatalmas támadás rázta meg: a KelpDAO esetében néhány nap alatt mintegy 20 milliárd dollárnyi (kb...

csütörtök 21:23

Az újabb Vercel-adatlopás több fiókot is érint

Ez a jelenség jól illusztrálható azzal, hogy a Vercel fejlesztői platform adatvédelmi incidense jóval súlyosabbnak bizonyult a kezdeti becsléseknél...

csütörtök 21:12

Az első agyi párbeszéd: mesterséges és valódi idegsejtek összekapcsolódnak

Egészen új korszak nyílhat az agyi technológiákban és az MI-számítógépekben, miután mérnököknek sikerült mesterséges idegsejteket kifejleszteniük, amelyek képesek kommunikálni valódi agysejtekkel...

csütörtök 20:56

A Coachella igazi sztárja: Justin Bieber óriásszivarja

🚬 Képzeld el: Justin Bieber két forró Coachella-fellépése után Los Angelesben ünnepel, egy szusi vacsora és baráti társaságban...

csütörtök 20:45

A kedvenc játékaidat már az MI mozgatja – és észre sem veszed

Felmerül a kérdés, hogy mennyire szövi át az MI a játékfejlesztést, miközben a játékipar éppen nehéz időszakát éli, és a fejlesztők és a játékosok is aggódva figyelik a változásokat...

csütörtök 20:23

Az év legdrámaibb űrpillanata: üstökös és meteor csap össze egy vár felett

🚀 Többek között egészen különleges pillanatot örökített meg két szerencsés fotós a csehországi Kutná Hora várromai felett...

csütörtök 20:11

A kvantumveszély közeleg: így védhető meg 1,7 millió bitcoin

⚠ Többek között a kvantumszámítógépek rohamos fejlődése miatt újra felmerült a kérdés: tényleg összeomlik a bitcoin, ha egy nap feltörhetővé válnak a régi, sebezhető címek?..

csütörtök 20:01

Az éj, amikor vámpírok és poénok elszabadulnak – TMZ Comedy Crawl

🎃 A Hollywood Improvban indult az este, ahol már a kezdetektől ingyen italokkal melegítették be a társaságot...

csütörtök 19:45

A kriptó lett a gépek bankja – az MI fizet

💰 Az elmúlt egy évben elképesztő ütemben terjedtek el az MI-ügynökök, amelyek nem csupán tanácsadói feladatokat, hanem valós pénzügyi tranzakciókat is végrehajtanak...

csütörtök 19:34

Az árnyékbankként működő kriptotőzsdék rejtett veszélyei

A kriptotőzsdék egyre inkább olyan szolgáltatásokat kínálnak, amelyek hasonlítanak a hagyományos banki termékekre, például kölcsönökre és hozamot ígérő konstrukciókra...

csütörtök 19:23

Az óriás médiaegyesülés: elkel a Warner Bros., megnyirbálják a vezér fizetését

Szerdán reggel virtuális közgyűlésen döntöttek a részvényesek: zöld utat adtak a Warner Bros...

csütörtök 19:12

Az Artemis II hőpajzsa sikerrel vette a tűzpróbát

A 2024. április 10-i sikeres visszatérés után az Artemis II hőpajzsa makulátlanul teljesített: az Orion űrkapszula vízreszállása után az amerikai haditengerészet búvárai különleges víz alatti fotót készítettek a jármű aljáról, amelyen jól látható, hogy a hőpajzs szinte érintetlen maradt...

csütörtök 19:01

Az MI-ügynökök összedolgoznak: megérkezett a BAND nagy dobása

Különösen igaz ez akkor, ha egy vállalat egyszerre több MI-ügynököt alkalmaz, amelyek egymással is kommunikálnak...

csütörtök 18:56

A szuperidősek titka: így marad éles az agy idősen

Több mint 25 éve kutatják a Northwestern Medicine szakemberei azokat a 80 év feletti embereket, akik szinte fiatalos szellemi frissességet őriztek meg idős korukra...

csütörtök 18:45

A mesterséges intelligencia új fizikai törvényeket fedezett fel a plazmában

A fizikusok mérföldkőhöz érkeztek: saját fejlesztésű neurális hálózatuk segítségével korábban ismeretlen részleteket tártak fel a részecskék kölcsönhatásáról az úgynevezett porplazmában...

csütörtök 18:34

Az újabb Tether-blokád: 120 milliárdot tiltott pénzek miatt fagyasztottak

A Tether mintegy 344 millió dollárnyi (közel 120 milliárd forint) USDT-t fagyasztott be a Tron-blokkláncon két pénztárcában, miután amerikai hatósági megkeresés nyomán felmerült a gyanú, hogy a digitális pénzek tiltott tevékenységhez kapcsolódnak...

csütörtök 18:23

Az űripar új ütőkártyája: a SpaceX saját GPU-t épít

🚀 Érdekes felvetés, hogy Elon Musk cégbirodalma már nemcsak rakétákkal és MI-kutatással, hanem saját grafikus processzorokkal is próbálkozik...

csütörtök 17:56

Az új WoW-frissítés teljes káoszt hozott: hibák özöne

A World of Warcraft legutóbbi, 12.0.5-ös frissítése minden eddiginél több hibát hozott magával, amelyek a játékosok kedvét is alaposan elveszik...

csütörtök 17:34

Az új Kötelesség hívása-film felforgatja a Yellowstone-univerzumot

🎬 Taylor Sheridan íróként és Pete Berg rendezőként érkezik a Kötelesség hívása (Call of Duty) filmhez, amelynek bemutatóját 2028...

csütörtök 17:23

Az egyiptomi múmia gyomrában bukkantak rá az Íliász egy darabjára

🗡 Erre utal többek között az, hogy régészek Egyiptomban egy római kori múmia hasüregében Homérosz Iliászának (The Iliad) papiruszára bukkantak...

csütörtök 16:56

A Fragmentary Order: fájdalom, kihívás, véres mámor – nem az Arc Raiders

Még mindig sokan szeretik azt az izgalmat, amit csak egy igazi, keményvonalas extraction shooter képes adni, és Nikita Buyanov, a legendás Tarkov atyja ezt most keményen az arcunkba is tolja a Fragmentary Orderrel...

csütörtök 16:45

Az új bélflóra-helyreállítás megelőzheti a visszahízást Ozempic után

Az elhízás elleni szerek, mint az Ozempic és a semaglutid segítségével sokan jelentős súlytól szabadulnak meg, ám a legtöbben a kezelés abbahagyását követően rövid idő alatt visszahíznak...

csütörtök 16:34

Az új Framework 13 Pro akkuidőben mindenkit leiskoláz

💻 A hordozható gamer gépeken dolgozók életét gyakran keseríti meg a lemerülő akkumulátor réme, de most úgy tűnik, új időszámítás kezdődhet: a Framework 13 Pro meglepően hosszú üzemidőt nyújt...

csütörtök 16:23

A Marson tényleg óriási „sárkánypikkelyek” hullámzanak a felszínen?

🐳 A NASA Curiosity marsjárója olyan furcsa, óriási, sokszög alakú képződményeket fotózott a vörös bolygón, amelyek első pillantásra leginkább hatalmas, fosszilis hüllőpikkelyekre emlékeztetnek...

csütörtök 16:12

Az öt legjobb ok, hogy most vegyél ventilátort – ne várj a kánikuláig

👀 Ahogy beköszönt a jó idő, hirtelen megemelkedik a hőmérséklet, sorra lobban fel a grillek lángja, és egy szempillantás alatt elkapkodják a boltokban a ventilátorokat...

csütörtök 16:02

A DJI Lito X1 lett a belépő drónok új királya

🚁 A DJI új Lito sorozata alaposan felforgatja a kezdő drónok piacát...

csütörtök 15:56

Az OpenAI ingyenes adatvédelmi eszköze valóban letarolja a piacot?

Az OpenAI jelentős lépést tett az adatvédelem felé a Privacy Filter nevű új, nyílt forráskódú modell megjelenésével...

csütörtök 15:45

Az inflációs sokk megakasztja a Bitcoin raliját

💸 Az elmúlt hetekben úgy tűnt, hogy a Bitcoin újabb áttörés előtt áll, amikor egészen 80 000 dollárig (kb...

csütörtök 15:34

Az MI feletti hatalomért folyik a könyörtelen küzdelem

Az összetett MI-ügynökök bevezetése a vállalatok életébe alaposan felforgatja az eddig ismert gyakorlatokat...