2025. 12. 02., 08:38

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar
Az OpenAI nehéz helyzetbe került, miután kénytelen lehet magyarázatot adni arra, miért törölte azokat az adathalmazokat, amelyeket engedély nélkül, kalózkönyvekből állított össze. Az ügy tétje óriási: ha a szerzők bebizonyítják, hogy az OpenAI jogsértő módon használta fel a műveiket a ChatGPT betanítása során, akár milliárdos büntetésre is számíthat a cég.

Kalóz könyvadatok: a vitatott Books 1 és Books 2 adathalmazok

A történet középpontjában két adathalmaz áll: a Books 1 és a Books 2, amelyeket még 2021-ben készítettek volt OpenAI-munkatársak. Ezekhez főként a LibGen (Library Genesis) nevű árnyékkönyvtárból származó, jogtalanul terjesztett műveket használtak fel. Bár az OpenAI szerint ezek az adathalmazok már 2021-ben kikerültek a használatból, és törölték őket még a ChatGPT 2022-es bemutatása előtt, sok szerző gyanítja, hogy ennél többről van szó.

A szerzők különösen gyanússá találták, hogy az OpenAI többször ellentmondott saját magának a törlés okairól. Előbb azt állították, a használat hiánya miatt törölték az adatokat, majd később minden, a törléshez fűződő magyarázatukat ügyvédi titoktartás mögé rejtették.

Bírósági nyomás alatt az OpenAI: ki kell adni a belső leveleket

Egy amerikai szövetségi bíró, Ona Wang úgy döntött, hogy az OpenAI-nak ki kell adnia minden olyan belső kommunikációt, amely a könyvadathalmazok törléséről szól, és amelyben a cég jogászai is érintettek. Wang megállapítása szerint az OpenAI nem titkolhatja el a törlési indokokat pusztán néhány szó kitakarásával vagy azzal, hogy az ügyvédi titoktartásra hivatkozik.

Az OpenAI azért is nehéz helyzetbe került, mert a bíró szerint, ha egy érvet vagy indokot – például a használat hiányát – már korábban közölt, akkor utólag nem nyilváníthatja titkossá, csak azért, hogy elkerülje a bírósági vizsgálatot. A vállalat december 8-ig köteles kiadni a kapcsolódó üzeneteket, és a bíróság a jogászaikat is beidézheti.

Továbbra is az a kérdés, hogy az OpenAI valóban azért törölte-e az adathalmazokat, mert felmerült a jogsértés gyanúja. Ugyanis ha a cég tudatosan próbálta eltitkolni a szerzői jogsértést, az súlyosbító körülmény lehet.

A szerzői jogi per tétje: szándékosan történt-e a kalózkodás

Egy szerzői jogi perben akár 150 000 USD (körülbelül 54 millió forint) kártérítést is megítélhetnek minden egyes jogsértett mű után, ha bebizonyosodik a szándékosság. A felperesek már azt is felvetették: elképzelhető, hogy az OpenAI csak átkeresztelte az adathalmazokat, és a jogi kockázat miatt papíron törölte őket, miközben tovább használja a tartalmakat.

A bíró azt is szóvá tette, hogy az OpenAI magát „jóhiszeműnek” állítja be, miközben ezt a védekezését próbálja eltüntetni a hivatalos iratokból. Az ilyen ellentmondásos lépések tovább erősítették a szerzők azon igényét, hogy betekinthessenek a belső üzenetváltásokba, amelyek kulcsfontosságúak lehetnek a jogsértés szándékosságának bizonyításához.


Bukdácsoló védekezés: téves hivatkozások, jogi csavarok

Az OpenAI jogászai utólag úgy próbálták értelmezni a bírói döntéseket, mintha azok igazolnák a könyvkalózkodási gyakorlat jogszerűségét – például arra hivatkoztak, hogy ha egy kalózmásolatot kizárólag MI‑tréningre használnak, az nem jogsértő. A bíró azonban világossá tette: az ilyen másolatok használata, még azonnali törlésük esetén is, egyértelműen jogellenes.

Következésképpen az OpenAI nagyot kockáztatott azáltal, hogy nem adta ki időben a belső kommunikációt, amellyel egyértelműsíthette volna a szándékosság vagy a jóhiszeműség kérdését. Ez a stratégia akár vissza is üthet: a bíróság szemében a védekezés alapját aknázhatja alá, ha a cég a jogi tanácsadásra hivatkozva egyszerre próbál érvelni és titkolózni.

Döntő lehet az ex-munkatárs tanúvallomása

A szerzők különösen kulcsfontosságúnak tartják, hogy tanúként hallgassa meg a bíróság az Anthropic MI‑cég jelenlegi vezérigazgatóját, Dario Amodeit, aki annak idején az OpenAI-nál felelt a vitatott adathalmazok létrehozásáért. Amodeinek információi lehetnek arról is, miként „semmisítették meg” valójában az adatbázisokat. Az OpenAI megpróbálta megakadályozni a tanúvallomását, de a bíróság végül a szerzőknek adott igazat.

Következésképpen az OpenAI számára nagy veszélyt rejt, hogy Amodei tanúvallomása vagy a kiadott belső üzenetváltások akár terhelő bizonyítékokat szolgáltathatnak a jogsértés szándékosságáról.

Mi jöhet most? Továbbra is lóg a levegőben a hatalmas kártérítés

Az, hogy az OpenAI az ügyvédi titoktartás mögé rejtőzik, és közben cáfolja a tudatos szerzői jogsértést, hosszú távon alááshatja a védekezését. A bíróság számára kulcsfontosságú lesz, hogy betekintést nyerjen az adathalmazok törlésével kapcsolatos levelezésekbe, a stratégia indítékaiba és a cég valódi szándékaiba.

Következésképpen, ha kiderül, hogy az OpenAI pontosan tudta: törvénybe ütköző volt a kalózkönyvek használata, és csak a lebukástól tartva törölték papíron az adatokat, akár példátlan összegű büntetés is kiszabható lehet rájuk. Már csak az a kérdés: valóban előkerülnek-e azok a bizonyos, évek óta eltitkolt levelezések, amelyek végleg eldöntik a bírósági pert.

2025, adminboss, arstechnica.com alapján

  • Te mit gondolsz, mennyire helyes egy cég részéről, hogy titkolja a belső kommunikációt egy jogi vita esetén?
  • Te mit tennél, ha a cégeddel kapcsolatban ilyen komoly szerzői jogi vádak merülnének fel?


Legfrissebb posztok

MA 06:58

Az Nvidia szoftverrel győzi le az AMD-t a tudományos MI-ben?

Az utóbbi években az MI fejlődése hatalmas teljesítményigénnyel párosul, különösen a tudományos és nagy számítási teljesítményű (HPC) alkalmazásokban...

MA 06:49

A Google új húzása: nehezebb lesz appot telepíteni Androidon

Androidon hamarosan megjelenik egy szigorúbb, úgynevezett „nagyobb súrlódású” (high-friction) kézi telepítési folyamat, amely minden olyan eszközt érint majd, amely Android 8...

MA 06:41

Az Ethereum: út a nyugdíjmilliókhoz, vagy csak délibáb?

Az Ethereum idén minden várakozást felülmúlhat, legalábbis a Standard Chartered elemzői szerint...

MA 06:33

A Gyűrűs-köd felfedi titkát: itt a vasóriás

🪐 Megvizsgálandó, hogy mi is rejtőzik valójában a Gyűrűs-köd színes gyűrűi mögött: európai csillagászok óriási, Mars-méretű vastömböt azonosítottak a világhírű planetáris köd belsejében...

MA 06:25

Az elektromos Porsche Macan meghódította Európát

A Porsche óriási sikert ért el Európában: tavaly több elektrifikált autót adott el, mint hagyományos benzinmotoros modellt...

MA 06:19

Az antarktiszi jégmag-archívum megmentheti a Föld klímamúltját

🌨 2026. január 14-én hivatalosan is megnyílt a világ leghidegebb könyvtára az Antarktiszon, a Concordia-állomás alatt...

MA 06:06

Történelmi események a mai napon (Január 19.)

Ezen a napon kirajzolódik Európa háborúinak és kultúrájának lenyomata: Rouen eleste és a normandiai visszahódítás csúcspontja, a tokiói nemzetközi törvényszék felállítása és Jan Palach önfeláldozó tiltakozása új irányt szabtak a történelemnek...

vasárnap 22:53

Az Acer szembeszáll az amerikai mobilszolgáltatókkal

Az Acer pert indított az Egyesült Államok három legnagyobb mobilszolgáltatója, a Verizon, az AT&T és a T-Mobile ellen, mivel állítása szerint a szolgáltatók jogtalanul használják az Acer mobilhálózati szabadalmait...

vasárnap 22:52

Az idei influenzaszezon pokoli: miért rosszabb, mint valaha?

Ami először apróságnak tűnt: nálunk is egyre több ismerős esik ágynak influenzával, a statisztikák pedig nem javítanak a helyzeten...

vasárnap 20:55

Az új Tuxedo laptop erősebb a Macnál, mégis könnyebb

A Tuxedo bemutatta az InfinityBook Max 16-ot, amely a Linuxra váltást tervezők számára kihagyhatatlan lehetőség...

vasárnap 20:37

Az újabb, pusztító chilei tűzvész miatt katasztrófahelyzetet hirdettek

Legalább tizenhatan vesztették életüket Chile középső részén, miután hatalmas erdőtüzek pusztítanak a Ñuble és Biobío régiókban, mintegy 500 km-re Santiagótól...

vasárnap 20:01

Az óceánok pusztulása megduplázza a klímaválság számláját

🌊 Az óceánok eddig rejtett gazdasági költsége Évtizedeken át a klímaváltozás gazdasági költségeit úgy becsülték, mintha az óceánok értéke nulla volna...

vasárnap 19:56

Az MI felrázza az egyetemet: új korszak a tanulásban

📚 Az elmúlt öt évben a felsőoktatás folyamatos felfordulásként élte meg a változásokat...

vasárnap 19:38

Az űrben felturbózott vírusok lehetnek a szuperbaktériumok veszte?

Amikor kutatók a Nemzetközi Űrállomásra (ISS) küldtek E. coli-t fertőző vírusokat, meglepő változások történtek...

vasárnap 19:20

Az ETF-csatában ki nyer: a bitcoinalapú IBIT vagy a sokszínű BITQ?

Felmerül a kérdés, hogy melyik kriptovaluta ETF érdemes igazán a figyelemre: az iShares által támogatott iShares Bitcoin Trust (IBIT), vagy a Bitwise Crypto Industry Innovators ETF (BITQ)...

vasárnap 18:56

Az 1,2 milliárd dollár a Bitcoinba ömlik: jön az új bikapiac?

📈 Egy lényeges szempont, hogy az amerikai tőzsdén jegyzett spot Bitcoin ETF-ekbe idén eddig 1,2 milliárd dollárnyi friss pénz áramlott be, ezzel megfordítva a decemberi visszaváltásokat...

vasárnap 18:37

Az utolsó ingyenes Windows 10-frissítések: ne maradj védelem nélkül

A Windows 10 támogatása hivatalosan 2025 októberében véget ér, emiatt sok felhasználó aggódhat, hogy mi lesz régi gépével vagy programjaival...

vasárnap 18:19

Az éledező bitcoin-éhség: nagyok és kicsik egyszerre vásárolnak

Az elmúlt egy hónapban a közepes és nagy bitcoin-tulajdonosok 110 000 BTC-t vásároltak, ami a legnagyobb havi növekedés a 2022-es FTX-összeomlás óta...

vasárnap 17:56

A Pandora űrtávcső forradalmasítja az élet utáni hajszát az űrben

Első pillantásra úgy tűnt, hogy a James Webb űrtávcső (JWST) már így is lenyűgöző eredményeket ér el a lakható exobolygók utáni kutatásban, de most egy új társ, a Pandora érkezése új lendületet ad ennek a küldetésnek...