Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar
Az OpenAI nehéz helyzetbe került, miután kénytelen lehet magyarázatot adni arra, miért törölte azokat az adathalmazokat, amelyeket engedély nélkül, kalózkönyvekből állított össze. Az ügy tétje óriási: ha a szerzők bebizonyítják, hogy az OpenAI jogsértő módon használta fel a műveiket a ChatGPT betanítása során, akár milliárdos büntetésre is számíthat a cég.

Kalóz könyvadatok: a vitatott Books 1 és Books 2 adathalmazok

A történet középpontjában két adathalmaz áll: a Books 1 és a Books 2, amelyeket még 2021-ben készítettek volt OpenAI-munkatársak. Ezekhez főként a LibGen (Library Genesis) nevű árnyékkönyvtárból származó, jogtalanul terjesztett műveket használtak fel. Bár az OpenAI szerint ezek az adathalmazok már 2021-ben kikerültek a használatból, és törölték őket még a ChatGPT 2022-es bemutatása előtt, sok szerző gyanítja, hogy ennél többről van szó.

A szerzők különösen gyanússá találták, hogy az OpenAI többször ellentmondott saját magának a törlés okairól. Előbb azt állították, a használat hiánya miatt törölték az adatokat, majd később minden, a törléshez fűződő magyarázatukat ügyvédi titoktartás mögé rejtették.

Bírósági nyomás alatt az OpenAI: ki kell adni a belső leveleket

Egy amerikai szövetségi bíró, Ona Wang úgy döntött, hogy az OpenAI-nak ki kell adnia minden olyan belső kommunikációt, amely a könyvadathalmazok törléséről szól, és amelyben a cég jogászai is érintettek. Wang megállapítása szerint az OpenAI nem titkolhatja el a törlési indokokat pusztán néhány szó kitakarásával vagy azzal, hogy az ügyvédi titoktartásra hivatkozik.

Az OpenAI azért is nehéz helyzetbe került, mert a bíró szerint, ha egy érvet vagy indokot – például a használat hiányát – már korábban közölt, akkor utólag nem nyilváníthatja titkossá, csak azért, hogy elkerülje a bírósági vizsgálatot. A vállalat december 8-ig köteles kiadni a kapcsolódó üzeneteket, és a bíróság a jogászaikat is beidézheti.

Továbbra is az a kérdés, hogy az OpenAI valóban azért törölte-e az adathalmazokat, mert felmerült a jogsértés gyanúja. Ugyanis ha a cég tudatosan próbálta eltitkolni a szerzői jogsértést, az súlyosbító körülmény lehet.

A szerzői jogi per tétje: szándékosan történt-e a kalózkodás

Egy szerzői jogi perben akár 150 000 USD (körülbelül 54 millió forint) kártérítést is megítélhetnek minden egyes jogsértett mű után, ha bebizonyosodik a szándékosság. A felperesek már azt is felvetették: elképzelhető, hogy az OpenAI csak átkeresztelte az adathalmazokat, és a jogi kockázat miatt papíron törölte őket, miközben tovább használja a tartalmakat.

A bíró azt is szóvá tette, hogy az OpenAI magát „jóhiszeműnek” állítja be, miközben ezt a védekezését próbálja eltüntetni a hivatalos iratokból. Az ilyen ellentmondásos lépések tovább erősítették a szerzők azon igényét, hogy betekinthessenek a belső üzenetváltásokba, amelyek kulcsfontosságúak lehetnek a jogsértés szándékosságának bizonyításához.


Bukdácsoló védekezés: téves hivatkozások, jogi csavarok

Az OpenAI jogászai utólag úgy próbálták értelmezni a bírói döntéseket, mintha azok igazolnák a könyvkalózkodási gyakorlat jogszerűségét – például arra hivatkoztak, hogy ha egy kalózmásolatot kizárólag MI‑tréningre használnak, az nem jogsértő. A bíró azonban világossá tette: az ilyen másolatok használata, még azonnali törlésük esetén is, egyértelműen jogellenes.

Következésképpen az OpenAI nagyot kockáztatott azáltal, hogy nem adta ki időben a belső kommunikációt, amellyel egyértelműsíthette volna a szándékosság vagy a jóhiszeműség kérdését. Ez a stratégia akár vissza is üthet: a bíróság szemében a védekezés alapját aknázhatja alá, ha a cég a jogi tanácsadásra hivatkozva egyszerre próbál érvelni és titkolózni.

Döntő lehet az ex-munkatárs tanúvallomása

A szerzők különösen kulcsfontosságúnak tartják, hogy tanúként hallgassa meg a bíróság az Anthropic MI‑cég jelenlegi vezérigazgatóját, Dario Amodeit, aki annak idején az OpenAI-nál felelt a vitatott adathalmazok létrehozásáért. Amodeinek információi lehetnek arról is, miként „semmisítették meg” valójában az adatbázisokat. Az OpenAI megpróbálta megakadályozni a tanúvallomását, de a bíróság végül a szerzőknek adott igazat.

Következésképpen az OpenAI számára nagy veszélyt rejt, hogy Amodei tanúvallomása vagy a kiadott belső üzenetváltások akár terhelő bizonyítékokat szolgáltathatnak a jogsértés szándékosságáról.

Mi jöhet most? Továbbra is lóg a levegőben a hatalmas kártérítés

Az, hogy az OpenAI az ügyvédi titoktartás mögé rejtőzik, és közben cáfolja a tudatos szerzői jogsértést, hosszú távon alááshatja a védekezését. A bíróság számára kulcsfontosságú lesz, hogy betekintést nyerjen az adathalmazok törlésével kapcsolatos levelezésekbe, a stratégia indítékaiba és a cég valódi szándékaiba.

Következésképpen, ha kiderül, hogy az OpenAI pontosan tudta: törvénybe ütköző volt a kalózkönyvek használata, és csak a lebukástól tartva törölték papíron az adatokat, akár példátlan összegű büntetés is kiszabható lehet rájuk. Már csak az a kérdés: valóban előkerülnek-e azok a bizonyos, évek óta eltitkolt levelezések, amelyek végleg eldöntik a bírósági pert.

2025, adminboss, arstechnica.com alapján

  • Te mit gondolsz, mennyire helyes egy cég részéről, hogy titkolja a belső kommunikációt egy jogi vita esetén?
  • Te mit tennél, ha a cégeddel kapcsolatban ilyen komoly szerzői jogi vádak merülnének fel?


Legfrissebb posztok

szombat 18:40

Leghaszontalanabb amerikai szlengek és idiómák

“Wallet biopsy” Szó szerint: pénztárca-biopszia 💸, amikor egy orvos vagy egészségügyi szolgáltató előbb ellenőrzi 🔬, mennyi pénzed / biztosításod van, és aztán dönti el, milyen vizsgálatot kapsz...

csütörtök 18:24

Penrose szám: A bizonyíték Isten létére?

Sir Roger Penrose brit matematikus és elméleti fizikus, aki a fekete lyukak szingularitásának és az általános relativitáselmélet új matematikai alapjainak feltárásáért kapott Nobel-díjat, az 1970-es években sokkoló, a tudományos világot megosztó tézist közölt...

MA 10:02

Az új Samsung-csoda: jön a háromszor hajtogatható mobil

📱 Végre itt a Samsung első háromszor hajlítható okostelefonja, a Galaxy Z TriFold, amely komoly válasz a kínai cégek egyre élesebb kihívásaira...

MA 09:57

Az agy öt fordulópontja: mikor alakul át igazán az elménk?

Bizonyos jelek arra utalnak, hogy az emberi agy életünk során öt jelentős szakaszon megy keresztül, amikor gyökeresen átrendezi saját belső hálózatát...

MA 09:50

A svédek kutatása megrengetheti Kína ritkaföldfém-uralmát

🌎 A fenntartható társadalomhoz nélkülözhetetlen anyagokat ma még messze nem környezetbarát módszerekkel termelik ki, a ritkaföldfém-alapú mágneseket pedig többnyire Kínában gyártják, ahol a szabályozás is teljesen eltér, például a svédtől...

MA 09:43

Az OpenAI pénzkörhintája: ki kinek fizet, és miért?

💳 Az OpenAI tulajdonosként beszállt a Thrive Holdings nevű cégbe, amely a Thrive Capital magántőke-befektető egyik leányvállalata – miközben a Thrive Capital korábban maga is dollármilliárdokkal támogatta az OpenAI-t...

MA 09:37

Az orosz űrprogram a padlón: egy rakétaindítás szétrombolta az űrkikötőt

Oroszország emberes űrprogramja történelmi válságba került, miután egyetlen működő rakétaindító állása súlyosan megsérült a legutóbbi Nemzetközi Űrállomásra (ISS) tartó misszió során...

MA 09:29

A Signal új biztonsági mentése: végre iOS-en is biztonságban a beszélgetések!

🔒 A Signal biztonságos mentései végre megérkeztek iOS-re, így a felhasználók mostantól gond nélkül visszaállíthatják a csevegéseiket, ha a telefonjuk sérül vagy elvész...

MA 09:23

Az MI-őrület elszabadult: drágulás, hiány és pánik az elektronikai piacon

🔥 Megvizsgálandó, hogy az MI-infrastruktúra kiépítése milyen komoly feszültségeket okoz az alkatrészpiacon – a legkeresettebb chipek és memóriák ára sosem látott magasságokba szökik, és ez akár a legnépszerűbb kütyük árának emelkedéséhez vagy hiányához is vezethet...

MA 09:15

Jön a grafénforradalom: az energiatárolás új sebességre kapcsol

⚡ Nem mindennapi áttörést értek el ausztrál mérnökök: új szénalapú anyagukkal forradalmasíthatják az energiatárolást, ötvözve a villámgyors töltést és a nagy teljesítményt...

MA 09:09

A megdöbbentő leleplezés: Edge és Chrome bővítmények 4,3 milliót kémleltek

Évekig rejtőzködő böngészőbővítmények figyelték és támadták meg 4,3 millió Chrome- és Edge-felhasználó számítógépét, hátsóajtót és kémprogramokat telepítve, hogy érzékeny adatokat továbbítsanak kínai szerverekre...

MA 09:03

A nagy áttörés előtt: tényleg közel a HIV funkcionális gyógyítása?

Nehéz elhinni, de világszerte mintegy 40 millió ember él HIV-fertőzéssel. Bár ma már a vírus nem jelent halálos ítéletet, az érintetteknek élethosszig tartó gyógyszeres kezelésre van szükségük egészségük fenntartásához...

MA 08:57

Az Nvidia újabb 730 milliárddal turbózza a GPU-forradalmat

🚀 Az Nvidia 730 milliárd forintot (2 milliárd dollárt) fektetett a chiptervező óriás, a Synopsys részvényeibe, hogy a GPU-kat nélkülözhetetlenné tegye a tervező- és szimulációs szoftverekben...

MA 08:45

Az intersztelláris üstökösön elszabadultak a jeges vulkánok

💨 Kezdetben az üstökösök csupán titokzatos vándoroknak tűntek, ám most mindenkit meglepett, amit a 3I/ATLAS jelű intersztelláris üstökösről kiderült...

MA 08:29

Az Instagram visszarendeli a dolgozókat – tényleg vége a home office-nak?

💻 2026 februárjától az Instagramnál dolgozók heti öt napot töltenek az irodában...

MA 08:22

Az internetes tanúsítványok érvényessége vészesen rövidül

Let’s Encrypt, a világ egyik legnagyobb hitelesítésszolgáltatója hamarosan jelentősen lerövidíti az általa kiadott tanúsítványok érvényességi idejét...

MA 08:16

Az új hárompaneles szenzáció: mindjárt itt a Galaxy Z TriFold

A Samsung bemutatta legújabb csúcsmodelljét, a várva várt Galaxy Z TriFoldot...

MA 08:01

Távozik az Apple MI-vezére, új sztárkutató érkezik

John Giannandrea, az Apple gépi tanulási és MI-stratégiáért felelős alelnöke távozik pozíciójából, és 2026 tavaszán visszavonul...

MA 07:57

Az első nagy áttörés: már felismerjük, ha téved a kvantumszámítógép

A kvantumszámítógépek hosszú évek óta ígérik, hogy megoldják azokat a problémákat is, amelyekre még a legerősebb hagyományos gépek is csak évmilliók alatt adnának választ...