2025. 12. 02., 08:38

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar
Az OpenAI nehéz helyzetbe került, miután kénytelen lehet magyarázatot adni arra, miért törölte azokat az adathalmazokat, amelyeket engedély nélkül, kalózkönyvekből állított össze. Az ügy tétje óriási: ha a szerzők bebizonyítják, hogy az OpenAI jogsértő módon használta fel a műveiket a ChatGPT betanítása során, akár milliárdos büntetésre is számíthat a cég.

Kalóz könyvadatok: a vitatott Books 1 és Books 2 adathalmazok

A történet középpontjában két adathalmaz áll: a Books 1 és a Books 2, amelyeket még 2021-ben készítettek volt OpenAI-munkatársak. Ezekhez főként a LibGen (Library Genesis) nevű árnyékkönyvtárból származó, jogtalanul terjesztett műveket használtak fel. Bár az OpenAI szerint ezek az adathalmazok már 2021-ben kikerültek a használatból, és törölték őket még a ChatGPT 2022-es bemutatása előtt, sok szerző gyanítja, hogy ennél többről van szó.

A szerzők különösen gyanússá találták, hogy az OpenAI többször ellentmondott saját magának a törlés okairól. Előbb azt állították, a használat hiánya miatt törölték az adatokat, majd később minden, a törléshez fűződő magyarázatukat ügyvédi titoktartás mögé rejtették.

Bírósági nyomás alatt az OpenAI: ki kell adni a belső leveleket

Egy amerikai szövetségi bíró, Ona Wang úgy döntött, hogy az OpenAI-nak ki kell adnia minden olyan belső kommunikációt, amely a könyvadathalmazok törléséről szól, és amelyben a cég jogászai is érintettek. Wang megállapítása szerint az OpenAI nem titkolhatja el a törlési indokokat pusztán néhány szó kitakarásával vagy azzal, hogy az ügyvédi titoktartásra hivatkozik.

Az OpenAI azért is nehéz helyzetbe került, mert a bíró szerint, ha egy érvet vagy indokot – például a használat hiányát – már korábban közölt, akkor utólag nem nyilváníthatja titkossá, csak azért, hogy elkerülje a bírósági vizsgálatot. A vállalat december 8-ig köteles kiadni a kapcsolódó üzeneteket, és a bíróság a jogászaikat is beidézheti.

Továbbra is az a kérdés, hogy az OpenAI valóban azért törölte-e az adathalmazokat, mert felmerült a jogsértés gyanúja. Ugyanis ha a cég tudatosan próbálta eltitkolni a szerzői jogsértést, az súlyosbító körülmény lehet.

A szerzői jogi per tétje: szándékosan történt-e a kalózkodás

Egy szerzői jogi perben akár 150 000 USD (körülbelül 54 millió forint) kártérítést is megítélhetnek minden egyes jogsértett mű után, ha bebizonyosodik a szándékosság. A felperesek már azt is felvetették: elképzelhető, hogy az OpenAI csak átkeresztelte az adathalmazokat, és a jogi kockázat miatt papíron törölte őket, miközben tovább használja a tartalmakat.

A bíró azt is szóvá tette, hogy az OpenAI magát „jóhiszeműnek” állítja be, miközben ezt a védekezését próbálja eltüntetni a hivatalos iratokból. Az ilyen ellentmondásos lépések tovább erősítették a szerzők azon igényét, hogy betekinthessenek a belső üzenetváltásokba, amelyek kulcsfontosságúak lehetnek a jogsértés szándékosságának bizonyításához.


Bukdácsoló védekezés: téves hivatkozások, jogi csavarok

Az OpenAI jogászai utólag úgy próbálták értelmezni a bírói döntéseket, mintha azok igazolnák a könyvkalózkodási gyakorlat jogszerűségét – például arra hivatkoztak, hogy ha egy kalózmásolatot kizárólag MI‑tréningre használnak, az nem jogsértő. A bíró azonban világossá tette: az ilyen másolatok használata, még azonnali törlésük esetén is, egyértelműen jogellenes.

Következésképpen az OpenAI nagyot kockáztatott azáltal, hogy nem adta ki időben a belső kommunikációt, amellyel egyértelműsíthette volna a szándékosság vagy a jóhiszeműség kérdését. Ez a stratégia akár vissza is üthet: a bíróság szemében a védekezés alapját aknázhatja alá, ha a cég a jogi tanácsadásra hivatkozva egyszerre próbál érvelni és titkolózni.

Döntő lehet az ex-munkatárs tanúvallomása

A szerzők különösen kulcsfontosságúnak tartják, hogy tanúként hallgassa meg a bíróság az Anthropic MI‑cég jelenlegi vezérigazgatóját, Dario Amodeit, aki annak idején az OpenAI-nál felelt a vitatott adathalmazok létrehozásáért. Amodeinek információi lehetnek arról is, miként „semmisítették meg” valójában az adatbázisokat. Az OpenAI megpróbálta megakadályozni a tanúvallomását, de a bíróság végül a szerzőknek adott igazat.

Következésképpen az OpenAI számára nagy veszélyt rejt, hogy Amodei tanúvallomása vagy a kiadott belső üzenetváltások akár terhelő bizonyítékokat szolgáltathatnak a jogsértés szándékosságáról.

Mi jöhet most? Továbbra is lóg a levegőben a hatalmas kártérítés

Az, hogy az OpenAI az ügyvédi titoktartás mögé rejtőzik, és közben cáfolja a tudatos szerzői jogsértést, hosszú távon alááshatja a védekezését. A bíróság számára kulcsfontosságú lesz, hogy betekintést nyerjen az adathalmazok törlésével kapcsolatos levelezésekbe, a stratégia indítékaiba és a cég valódi szándékaiba.

Következésképpen, ha kiderül, hogy az OpenAI pontosan tudta: törvénybe ütköző volt a kalózkönyvek használata, és csak a lebukástól tartva törölték papíron az adatokat, akár példátlan összegű büntetés is kiszabható lehet rájuk. Már csak az a kérdés: valóban előkerülnek-e azok a bizonyos, évek óta eltitkolt levelezések, amelyek végleg eldöntik a bírósági pert.

2025, adminboss, arstechnica.com alapján

  • Te mit gondolsz, mennyire helyes egy cég részéről, hogy titkolja a belső kommunikációt egy jogi vita esetén?
  • Te mit tennél, ha a cégeddel kapcsolatban ilyen komoly szerzői jogi vádak merülnének fel?


Legfrissebb posztok

MA 07:46

A legendás Warhammer-művész, John Blanche meghalt

🖤 Külön említést érdemel, hogy az egyik legmeghatározóbb illusztrátor, John Blanche, 77 évesen távozott közülünk...

MA 07:28

A NASA szerint a MAVEN már menthetetlen – vége a küldetésnek

🚀 A NASA hivatalosan is megerősítette, hogy a MAVEN űrszonda végleg megszűnt működni, miután tavaly decemberben megszakadt vele a kapcsolat...

MA 07:10

A legjobb Final Fantasy XIV szezonális események: mire számíts, mikor várhatók?

🎉 A népszerű MMO világában mindig történik valami szokatlanul izgalmas, legyen szó ünnepekről vagy éppen meglepetésakciókról...

MA 07:01

A 20 legjobb fejhallgató 24 ezer alatt, százával ötcsillaggal

Nem muszáj vagyonokat költeni egy igazán jó fejhallgatóra – akár már 2 ezer forintért (8 AUD) remekül értékelt darabokat is lehet találni az Amazonon...

MA 06:55

Az első DRAM nélküli Gen5 SSD‑vezérlő: csúcstempó, energiahatékonysági bajnokjelölt

Érdemes megjegyezni, hogy az SSD-k ára rohamosan emelkedik, főként az MI-vel kapcsolatos igények miatt...

MA 06:46

A Scott Pelley kirúgása után pánik a CBS Newsnál Bari Weiss alatt

🚨 Rekordsebességgel dúl a feszültség a CBS News szerkesztőségében, miután a 60 perc (60 Minutes) veterán tudósítóját, Scott Pelley-t egyik napról a másikra menesztették...

MA 06:36

A bitcoin 62 ezer alá bukott, longokban másfél milliárd dollárnyi tűnt el

A bitcoin ára rövid időre 62 000 dollár (kb. 22,2 millió forint) alá esett az ázsiai kereskedésben, amivel több mint 1,5 milliárd dollár (közel 540 milliárd forint) értékű, tőkeáttételes kriptópozíciók kényszerlikvidálását váltotta ki egyetlen nap alatt...

MA 06:28

A Google 64 millió baktériumos szúnyogot engedne szabadon – a tudósok lelkesek

Egy szokatlan kísérlet készül indulni Kalifornia és Florida területén: a Google célja, hogy 64 millió baktériummal fertőzött szúnyogot engedjen szabadon a két államban...

MA 06:18

A Bitmine új húzása: 9,5% hozam elsőbbségi részvényekkel

Senki sem várta volna, hogy az Ethereum egyik legnagyobb tartalékkal rendelkező cége, a Bitmine, Michael Saylor nyomdokain haladva próbálja meg mozgatni a piacot...

MA 06:05

Történelmi események a mai napon (Június 4.)

Rövid áttekintés: Ezen a napon egyszerre ért véget a dunkerque-i evakuálás és kezdődött el a döntő jelentőségű Midway-i csata, miközben Róma az első tengelyhatalmi fővárosként az amerikaiak és szövetségeseik kezére került...

szerda 17:23

A Bitcoin történelmi támasznál jár – közeleg az újabb rali?

💰 Érdemes megérteni, hogy a Bitcoin árfolyama szerdán rövid időre 66 000 dollár (kb...

szerda 17:12

A Bitcoin lendületmutató szerint jöhet a felpattanás, de óvatosak a szakértők

📈 Erre utal többek között az, hogy a kriptopénzek piaca szerdán stabilizálódni látszott a korábbi esés után, miután a legnagyobb tőzsdén jegyzett bitcoin-tulajdonos, a MicroStrategy (MSTR) tartalékai egy újabb kis részét értékesítette, és a tőzsdei bitcoinalapok (ETF-ek) is sorozatban rekordösszegű kiáramlásokat könyveltek el...

szerda 17:03

A megfizethető szupertele: SIGMA 150–600 mm Sport teszt vadfotós szemmel

Ez a jelenség jól illusztrálható azzal, hogy egyre többen keresnek hosszú gyújtótávolságú, megfizethető objektíveket, hogy komolyabb szintre emeljék a természet- vagy madárfotózást, kompromisszumok nélkül...

szerda 16:45

A szupersportkocsit idéző hangú, kisautónyi árú fejhallgató

🚗 A Meze Audio ismét megmutatta, hogy nem ismer kompromisszumot, ha audiofil fejhallgatókról van szó...

szerda 16:02

A napfényben fürdő Lisszabon újra életre kel

🌅 A portugál főváros színei, ahogy a napfény játszik velük, semmilyen virághoz sem hasonlíthatók...

szerda 15:57

A GTX 1080 Ti: még Jensen Huang is etalonnak tartja

👑 A Computex rendezvény egy váratlan pillanatát örökítették meg, amikor Jensen Huang, az Nvidia vezérigazgatója, rajongók között autogramot osztogatott – igazi sztárként ünnepelték...

szerda 15:45

A Hosszú Menetelés–12B titokban startolt – biztonsági figyelmeztetés nélkül

Erre utal többek között az is, hogy Kína hétfőn váratlanul, előzetes figyelmeztetés nélkül bocsátotta fel legújabb, újrafelhasználható hordozórakétáját, a Long March 12B-t...

szerda 15:24

A Final Fantasy 14 magányos kihívója megint legyőzi a lehetetlent, ezúttal önfelrobbantással

A Final Fantasy 14 világában a többjátékos együttműködés alapfeltétel, ám van, aki mindezt egyedül próbálja teljesíteni...

szerda 15:13

A Corsair új, állítólag megfizethető széke szakít a gagyi gamer stílussal

Lényeges szempont, hogy a Corsair legújabb széke nem akar magára venni neonfényes, rikító dizájnt, mint a hagyományos gamer székeké...

szerda 15:01

A rocksztár apuka a lánya lábmodell-karrierjét is támogatja

💃 Raine Michaels, Bret Michaels lánya, egy új valóságshow-ban szerepel, ahol nyíltan beszél az életéről – még arról is, hogy lábáról készült fotókkal keresne pénzt...

szerda 14:55

Az óriások beszállnak: Stripe, Visa, Mastercard egy új stabilcoin‑platform mögött

A háttérben egészen más zajlott: a Stripe, a Visa és a Mastercard hamarosan közösen indítanak egy stabilcoin‑platformot, amelyhez az amerikai Coinbase kriptotőzsde is csatlakozhat...

szerda 14:45

A Grayscale bevezeti a legolcsóbb amerikai Hyperliquid ETF-et, forr a HYPE-verseny

Az új Grayscale Hyperliquid Staking ETF (HYPG) megjelent a Nasdaqon, és rögtön a legalacsonyabb díjat kínálja az amerikai Hyperliquid ETF-ek között...

szerda 14:35

A retró királya: a Lumix L10 letaszítja az X100VI-t

A Panasonic Lumix L10 egy modern kompakt fényképezőgép, amely a nosztalgikus dizájnt ötvözi a legújabb technológiákkal...

szerda 14:24

A ChatGPT rejtett chatlimitje: ez történik, amikor eléred

Sokan úgy gondolják, hogy egy csevegés az MI-vel szinte végtelen lehet, de valójában bármelyik ChatGPT-beszélgetés egyszer eléri a végét...

szerda 14:01

A DeFi nem hódítja meg a nagybankokat, amíg nem fékezi a hackertámadásokat

🔒 A decentralizált pénzügyi megoldások (DeFi) valódi jelentőségét nem a spekulatív kereskedés, hanem a nemzetközi bankrendszer háttérfolyamatainak átalakítása adhatja meg...

szerda 13:56

A megmagyarázhatatlan vérzés: a fiú szeméből, füléből, orrából folyt a vér

😱 Egy 11 éves indiai fiú szülei kétségbeesetten fordultak orvoshoz, amikor fiuk különös tüneteket produkált: szeméből, füléből és orrából időnként vér szivárgott mindenféle látható ok nélkül...

szerda 13:45

A walesi barlang 17 ezer éves vörös csíkjai: a legősibb brit sziklarajz

🪖 Több mint száz évvel azután, hogy egy walesi barlang falán vörös vonalakat fedeztek fel, most úgy tűnik, sikerült bizonyítani, hogy ezek a legrégebbi ismert sziklarajzok a Brit-szigeteken...

szerda 13:33

A Trezor szerint biztonságban a kriptód a Ledger által feltárt hiba után

🔐 A Trezor hardveres kriptotárcák gyártója egy chiphibát tárt fel vadonatúj Safe 7 készülékében, miután a rivális Ledger kutatói sikeresen demonstráltak egy laboratóriumi támadást...

szerda 13:23

A stabilcoinok megrengethetik a hitelezést – aggódnak az amerikai bankok

💰 Érdemes megvizsgálni, hogy az amerikai bankok miért tartanak a stabilcoinok elterjedésétől, és miként próbálnak hatni a törvényhozókra a digitális eszközök szabályozására...