2025. 12. 02., 08:38

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar
Az OpenAI nehéz helyzetbe került, miután kénytelen lehet magyarázatot adni arra, miért törölte azokat az adathalmazokat, amelyeket engedély nélkül, kalózkönyvekből állított össze. Az ügy tétje óriási: ha a szerzők bebizonyítják, hogy az OpenAI jogsértő módon használta fel a műveiket a ChatGPT betanítása során, akár milliárdos büntetésre is számíthat a cég.

Kalóz könyvadatok: a vitatott Books 1 és Books 2 adathalmazok

A történet középpontjában két adathalmaz áll: a Books 1 és a Books 2, amelyeket még 2021-ben készítettek volt OpenAI-munkatársak. Ezekhez főként a LibGen (Library Genesis) nevű árnyékkönyvtárból származó, jogtalanul terjesztett műveket használtak fel. Bár az OpenAI szerint ezek az adathalmazok már 2021-ben kikerültek a használatból, és törölték őket még a ChatGPT 2022-es bemutatása előtt, sok szerző gyanítja, hogy ennél többről van szó.

A szerzők különösen gyanússá találták, hogy az OpenAI többször ellentmondott saját magának a törlés okairól. Előbb azt állították, a használat hiánya miatt törölték az adatokat, majd később minden, a törléshez fűződő magyarázatukat ügyvédi titoktartás mögé rejtették.

Bírósági nyomás alatt az OpenAI: ki kell adni a belső leveleket

Egy amerikai szövetségi bíró, Ona Wang úgy döntött, hogy az OpenAI-nak ki kell adnia minden olyan belső kommunikációt, amely a könyvadathalmazok törléséről szól, és amelyben a cég jogászai is érintettek. Wang megállapítása szerint az OpenAI nem titkolhatja el a törlési indokokat pusztán néhány szó kitakarásával vagy azzal, hogy az ügyvédi titoktartásra hivatkozik.

Az OpenAI azért is nehéz helyzetbe került, mert a bíró szerint, ha egy érvet vagy indokot – például a használat hiányát – már korábban közölt, akkor utólag nem nyilváníthatja titkossá, csak azért, hogy elkerülje a bírósági vizsgálatot. A vállalat december 8-ig köteles kiadni a kapcsolódó üzeneteket, és a bíróság a jogászaikat is beidézheti.

Továbbra is az a kérdés, hogy az OpenAI valóban azért törölte-e az adathalmazokat, mert felmerült a jogsértés gyanúja. Ugyanis ha a cég tudatosan próbálta eltitkolni a szerzői jogsértést, az súlyosbító körülmény lehet.

A szerzői jogi per tétje: szándékosan történt-e a kalózkodás

Egy szerzői jogi perben akár 150 000 USD (körülbelül 54 millió forint) kártérítést is megítélhetnek minden egyes jogsértett mű után, ha bebizonyosodik a szándékosság. A felperesek már azt is felvetették: elképzelhető, hogy az OpenAI csak átkeresztelte az adathalmazokat, és a jogi kockázat miatt papíron törölte őket, miközben tovább használja a tartalmakat.

A bíró azt is szóvá tette, hogy az OpenAI magát „jóhiszeműnek” állítja be, miközben ezt a védekezését próbálja eltüntetni a hivatalos iratokból. Az ilyen ellentmondásos lépések tovább erősítették a szerzők azon igényét, hogy betekinthessenek a belső üzenetváltásokba, amelyek kulcsfontosságúak lehetnek a jogsértés szándékosságának bizonyításához.


Bukdácsoló védekezés: téves hivatkozások, jogi csavarok

Az OpenAI jogászai utólag úgy próbálták értelmezni a bírói döntéseket, mintha azok igazolnák a könyvkalózkodási gyakorlat jogszerűségét – például arra hivatkoztak, hogy ha egy kalózmásolatot kizárólag MI‑tréningre használnak, az nem jogsértő. A bíró azonban világossá tette: az ilyen másolatok használata, még azonnali törlésük esetén is, egyértelműen jogellenes.

Következésképpen az OpenAI nagyot kockáztatott azáltal, hogy nem adta ki időben a belső kommunikációt, amellyel egyértelműsíthette volna a szándékosság vagy a jóhiszeműség kérdését. Ez a stratégia akár vissza is üthet: a bíróság szemében a védekezés alapját aknázhatja alá, ha a cég a jogi tanácsadásra hivatkozva egyszerre próbál érvelni és titkolózni.

Döntő lehet az ex-munkatárs tanúvallomása

A szerzők különösen kulcsfontosságúnak tartják, hogy tanúként hallgassa meg a bíróság az Anthropic MI‑cég jelenlegi vezérigazgatóját, Dario Amodeit, aki annak idején az OpenAI-nál felelt a vitatott adathalmazok létrehozásáért. Amodeinek információi lehetnek arról is, miként „semmisítették meg” valójában az adatbázisokat. Az OpenAI megpróbálta megakadályozni a tanúvallomását, de a bíróság végül a szerzőknek adott igazat.

Következésképpen az OpenAI számára nagy veszélyt rejt, hogy Amodei tanúvallomása vagy a kiadott belső üzenetváltások akár terhelő bizonyítékokat szolgáltathatnak a jogsértés szándékosságáról.

Mi jöhet most? Továbbra is lóg a levegőben a hatalmas kártérítés

Az, hogy az OpenAI az ügyvédi titoktartás mögé rejtőzik, és közben cáfolja a tudatos szerzői jogsértést, hosszú távon alááshatja a védekezését. A bíróság számára kulcsfontosságú lesz, hogy betekintést nyerjen az adathalmazok törlésével kapcsolatos levelezésekbe, a stratégia indítékaiba és a cég valódi szándékaiba.

Következésképpen, ha kiderül, hogy az OpenAI pontosan tudta: törvénybe ütköző volt a kalózkönyvek használata, és csak a lebukástól tartva törölték papíron az adatokat, akár példátlan összegű büntetés is kiszabható lehet rájuk. Már csak az a kérdés: valóban előkerülnek-e azok a bizonyos, évek óta eltitkolt levelezések, amelyek végleg eldöntik a bírósági pert.

2025, adminboss, arstechnica.com alapján

  • Te mit gondolsz, mennyire helyes egy cég részéről, hogy titkolja a belső kommunikációt egy jogi vita esetén?
  • Te mit tennél, ha a cégeddel kapcsolatban ilyen komoly szerzői jogi vádak merülnének fel?


Legfrissebb posztok

MA 08:55

Az AMD kemény vitája után visszatér az 5800X3D

🔥 Ebből következően érdemes megérteni, hogy miért döntött úgy az AMD, hogy ismét piacra dobja a régebbi, de ikonikusnak számító 5800X3D processzort...

MA 08:46

A Google nyílt forrású Gemma 4 12B helyben fut, hangot‑videót ért laptopon

A technológiai fejlődéssel sokan a minél nagyobb, komplexebb és drágább MI-modelleket keresik, de a Google most merőben más irányt vesz...

MA 08:36

Az atomtűzgolyó modellje váratlan titkot leplezett le a radioaktív kihullásban

💣 Egy nukleáris fegyver detonációjakor vagy egy súlyos reaktorbaleset esetén elképesztő mennyiségű energia szabadul fel, gyakorlatilag a másodperc milliomodrésze alatt...

MA 08:27

Az apró agyi áramkör, amellyel visszafordították a szorongást

💡 A spanyolországi Elche városában működő Idegtudományi Intézet kutatói jelentős áttörést értek el az érzelmi zavarok megértésében...

MA 08:19

A kaszáspókok Dél-Amerika őserdeiben békákra vadásznak és felfalják őket

🐍 A dél-amerikai trópusok sűrű esőerdeiben döbbenetes jelenetek játszódnak le: kaszáspókok (daddy longlegs) élő, náluk is nagyobb termetű békákat is elejtenek és felfalnak...

MA 08:01

Az egyre népszerűbb GLP-1 fogyókúrás szerek csökkenthetik a függőség és túladagolás kockázatát

Érdemes megemlíteni, hogy az olyan népszerű testsúlycsökkentő gyógyszerek, mint az Ozempic, a Wegovy, a Mounjaro és a Zepbound, eddig is forradalmasították a 2-es típusú cukorbetegség és az elhízás kezelését...

MA 07:55

Az olcsó ízületi gyógyszer új reményt adhat az RSV ellen

💉 Egy mindenki számára elérhető, olcsó fájdalomcsillapító, amelyet főként ízületi gyulladásra használnak, laboratóriumi körülmények között meglepően eredményesnek bizonyult a légúti RSV-fertőzés visszaszorításában...

MA 07:46

A legendás Warhammer-művész, John Blanche meghalt

🖤 Külön említést érdemel, hogy az egyik legmeghatározóbb illusztrátor, John Blanche, 77 évesen távozott közülünk...

MA 07:28

A NASA szerint a MAVEN már menthetetlen – vége a küldetésnek

🚀 A NASA hivatalosan is megerősítette, hogy a MAVEN űrszonda végleg megszűnt működni, miután tavaly decemberben megszakadt vele a kapcsolat...

MA 07:10

A legjobb Final Fantasy XIV szezonális események: mire számíts, mikor várhatók?

🎉 A népszerű MMO világában mindig történik valami szokatlanul izgalmas, legyen szó ünnepekről vagy éppen meglepetésakciókról...

MA 07:01

A 20 legjobb fejhallgató 24 ezer alatt, százával ötcsillaggal

Nem muszáj vagyonokat költeni egy igazán jó fejhallgatóra – akár már 2 ezer forintért (8 AUD) remekül értékelt darabokat is lehet találni az Amazonon...

MA 06:55

Az első DRAM nélküli Gen5 SSD‑vezérlő: csúcstempó, energiahatékonysági bajnokjelölt

Érdemes megjegyezni, hogy az SSD-k ára rohamosan emelkedik, főként az MI-vel kapcsolatos igények miatt...

MA 06:46

A Scott Pelley kirúgása után pánik a CBS Newsnál Bari Weiss alatt

🚨 Rekordsebességgel dúl a feszültség a CBS News szerkesztőségében, miután a 60 perc (60 Minutes) veterán tudósítóját, Scott Pelley-t egyik napról a másikra menesztették...

MA 06:36

A bitcoin 62 ezer alá bukott, longokban másfél milliárd dollárnyi tűnt el

A bitcoin ára rövid időre 62 000 dollár (kb. 22,2 millió forint) alá esett az ázsiai kereskedésben, amivel több mint 1,5 milliárd dollár (közel 540 milliárd forint) értékű, tőkeáttételes kriptópozíciók kényszerlikvidálását váltotta ki egyetlen nap alatt...

MA 06:28

A Google 64 millió baktériumos szúnyogot engedne szabadon – a tudósok lelkesek

Egy szokatlan kísérlet készül indulni Kalifornia és Florida területén: a Google célja, hogy 64 millió baktériummal fertőzött szúnyogot engedjen szabadon a két államban...

MA 06:18

A Bitmine új húzása: 9,5% hozam elsőbbségi részvényekkel

Senki sem várta volna, hogy az Ethereum egyik legnagyobb tartalékkal rendelkező cége, a Bitmine, Michael Saylor nyomdokain haladva próbálja meg mozgatni a piacot...

MA 06:05

Történelmi események a mai napon (Június 4.)

Rövid áttekintés: Ezen a napon egyszerre ért véget a dunkerque-i evakuálás és kezdődött el a döntő jelentőségű Midway-i csata, miközben Róma az első tengelyhatalmi fővárosként az amerikaiak és szövetségeseik kezére került...

szerda 17:23

A Bitcoin történelmi támasznál jár – közeleg az újabb rali?

💰 Érdemes megérteni, hogy a Bitcoin árfolyama szerdán rövid időre 66 000 dollár (kb...

szerda 17:12

A Bitcoin lendületmutató szerint jöhet a felpattanás, de óvatosak a szakértők

📈 Erre utal többek között az, hogy a kriptopénzek piaca szerdán stabilizálódni látszott a korábbi esés után, miután a legnagyobb tőzsdén jegyzett bitcoin-tulajdonos, a MicroStrategy (MSTR) tartalékai egy újabb kis részét értékesítette, és a tőzsdei bitcoinalapok (ETF-ek) is sorozatban rekordösszegű kiáramlásokat könyveltek el...

szerda 17:03

A megfizethető szupertele: SIGMA 150–600 mm Sport teszt vadfotós szemmel

Ez a jelenség jól illusztrálható azzal, hogy egyre többen keresnek hosszú gyújtótávolságú, megfizethető objektíveket, hogy komolyabb szintre emeljék a természet- vagy madárfotózást, kompromisszumok nélkül...

szerda 16:45

A szupersportkocsit idéző hangú, kisautónyi árú fejhallgató

🚗 A Meze Audio ismét megmutatta, hogy nem ismer kompromisszumot, ha audiofil fejhallgatókról van szó...

szerda 16:02

A napfényben fürdő Lisszabon újra életre kel

🌅 A portugál főváros színei, ahogy a napfény játszik velük, semmilyen virághoz sem hasonlíthatók...

szerda 15:57

A GTX 1080 Ti: még Jensen Huang is etalonnak tartja

👑 A Computex rendezvény egy váratlan pillanatát örökítették meg, amikor Jensen Huang, az Nvidia vezérigazgatója, rajongók között autogramot osztogatott – igazi sztárként ünnepelték...

szerda 15:45

A Hosszú Menetelés–12B titokban startolt – biztonsági figyelmeztetés nélkül

Erre utal többek között az is, hogy Kína hétfőn váratlanul, előzetes figyelmeztetés nélkül bocsátotta fel legújabb, újrafelhasználható hordozórakétáját, a Long March 12B-t...

szerda 15:24

A Final Fantasy 14 magányos kihívója megint legyőzi a lehetetlent, ezúttal önfelrobbantással

A Final Fantasy 14 világában a többjátékos együttműködés alapfeltétel, ám van, aki mindezt egyedül próbálja teljesíteni...

szerda 15:13

A Corsair új, állítólag megfizethető széke szakít a gagyi gamer stílussal

Lényeges szempont, hogy a Corsair legújabb széke nem akar magára venni neonfényes, rikító dizájnt, mint a hagyományos gamer székeké...

szerda 15:01

A rocksztár apuka a lánya lábmodell-karrierjét is támogatja

💃 Raine Michaels, Bret Michaels lánya, egy új valóságshow-ban szerepel, ahol nyíltan beszél az életéről – még arról is, hogy lábáról készült fotókkal keresne pénzt...

szerda 14:55

Az óriások beszállnak: Stripe, Visa, Mastercard egy új stabilcoin‑platform mögött

A háttérben egészen más zajlott: a Stripe, a Visa és a Mastercard hamarosan közösen indítanak egy stabilcoin‑platformot, amelyhez az amerikai Coinbase kriptotőzsde is csatlakozhat...

szerda 14:45

A Grayscale bevezeti a legolcsóbb amerikai Hyperliquid ETF-et, forr a HYPE-verseny

Az új Grayscale Hyperliquid Staking ETF (HYPG) megjelent a Nasdaqon, és rögtön a legalacsonyabb díjat kínálja az amerikai Hyperliquid ETF-ek között...