Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar
Az OpenAI nehéz helyzetbe került, miután kénytelen lehet magyarázatot adni arra, miért törölte azokat az adathalmazokat, amelyeket engedély nélkül, kalózkönyvekből állított össze. Az ügy tétje óriási: ha a szerzők bebizonyítják, hogy az OpenAI jogsértő módon használta fel a műveiket a ChatGPT betanítása során, akár milliárdos büntetésre is számíthat a cég.

Kalóz könyvadatok: a vitatott Books 1 és Books 2 adathalmazok

A történet középpontjában két adathalmaz áll: a Books 1 és a Books 2, amelyeket még 2021-ben készítettek volt OpenAI-munkatársak. Ezekhez főként a LibGen (Library Genesis) nevű árnyékkönyvtárból származó, jogtalanul terjesztett műveket használtak fel. Bár az OpenAI szerint ezek az adathalmazok már 2021-ben kikerültek a használatból, és törölték őket még a ChatGPT 2022-es bemutatása előtt, sok szerző gyanítja, hogy ennél többről van szó.

A szerzők különösen gyanússá találták, hogy az OpenAI többször ellentmondott saját magának a törlés okairól. Előbb azt állították, a használat hiánya miatt törölték az adatokat, majd később minden, a törléshez fűződő magyarázatukat ügyvédi titoktartás mögé rejtették.

Bírósági nyomás alatt az OpenAI: ki kell adni a belső leveleket

Egy amerikai szövetségi bíró, Ona Wang úgy döntött, hogy az OpenAI-nak ki kell adnia minden olyan belső kommunikációt, amely a könyvadathalmazok törléséről szól, és amelyben a cég jogászai is érintettek. Wang megállapítása szerint az OpenAI nem titkolhatja el a törlési indokokat pusztán néhány szó kitakarásával vagy azzal, hogy az ügyvédi titoktartásra hivatkozik.

Az OpenAI azért is nehéz helyzetbe került, mert a bíró szerint, ha egy érvet vagy indokot – például a használat hiányát – már korábban közölt, akkor utólag nem nyilváníthatja titkossá, csak azért, hogy elkerülje a bírósági vizsgálatot. A vállalat december 8-ig köteles kiadni a kapcsolódó üzeneteket, és a bíróság a jogászaikat is beidézheti.

Továbbra is az a kérdés, hogy az OpenAI valóban azért törölte-e az adathalmazokat, mert felmerült a jogsértés gyanúja. Ugyanis ha a cég tudatosan próbálta eltitkolni a szerzői jogsértést, az súlyosbító körülmény lehet.

A szerzői jogi per tétje: szándékosan történt-e a kalózkodás

Egy szerzői jogi perben akár 150 000 USD (körülbelül 54 millió forint) kártérítést is megítélhetnek minden egyes jogsértett mű után, ha bebizonyosodik a szándékosság. A felperesek már azt is felvetették: elképzelhető, hogy az OpenAI csak átkeresztelte az adathalmazokat, és a jogi kockázat miatt papíron törölte őket, miközben tovább használja a tartalmakat.

A bíró azt is szóvá tette, hogy az OpenAI magát „jóhiszeműnek” állítja be, miközben ezt a védekezését próbálja eltüntetni a hivatalos iratokból. Az ilyen ellentmondásos lépések tovább erősítették a szerzők azon igényét, hogy betekinthessenek a belső üzenetváltásokba, amelyek kulcsfontosságúak lehetnek a jogsértés szándékosságának bizonyításához.


Bukdácsoló védekezés: téves hivatkozások, jogi csavarok

Az OpenAI jogászai utólag úgy próbálták értelmezni a bírói döntéseket, mintha azok igazolnák a könyvkalózkodási gyakorlat jogszerűségét – például arra hivatkoztak, hogy ha egy kalózmásolatot kizárólag MI‑tréningre használnak, az nem jogsértő. A bíró azonban világossá tette: az ilyen másolatok használata, még azonnali törlésük esetén is, egyértelműen jogellenes.

Következésképpen az OpenAI nagyot kockáztatott azáltal, hogy nem adta ki időben a belső kommunikációt, amellyel egyértelműsíthette volna a szándékosság vagy a jóhiszeműség kérdését. Ez a stratégia akár vissza is üthet: a bíróság szemében a védekezés alapját aknázhatja alá, ha a cég a jogi tanácsadásra hivatkozva egyszerre próbál érvelni és titkolózni.

Döntő lehet az ex-munkatárs tanúvallomása

A szerzők különösen kulcsfontosságúnak tartják, hogy tanúként hallgassa meg a bíróság az Anthropic MI‑cég jelenlegi vezérigazgatóját, Dario Amodeit, aki annak idején az OpenAI-nál felelt a vitatott adathalmazok létrehozásáért. Amodeinek információi lehetnek arról is, miként „semmisítették meg” valójában az adatbázisokat. Az OpenAI megpróbálta megakadályozni a tanúvallomását, de a bíróság végül a szerzőknek adott igazat.

Következésképpen az OpenAI számára nagy veszélyt rejt, hogy Amodei tanúvallomása vagy a kiadott belső üzenetváltások akár terhelő bizonyítékokat szolgáltathatnak a jogsértés szándékosságáról.

Mi jöhet most? Továbbra is lóg a levegőben a hatalmas kártérítés

Az, hogy az OpenAI az ügyvédi titoktartás mögé rejtőzik, és közben cáfolja a tudatos szerzői jogsértést, hosszú távon alááshatja a védekezését. A bíróság számára kulcsfontosságú lesz, hogy betekintést nyerjen az adathalmazok törlésével kapcsolatos levelezésekbe, a stratégia indítékaiba és a cég valódi szándékaiba.

Következésképpen, ha kiderül, hogy az OpenAI pontosan tudta: törvénybe ütköző volt a kalózkönyvek használata, és csak a lebukástól tartva törölték papíron az adatokat, akár példátlan összegű büntetés is kiszabható lehet rájuk. Már csak az a kérdés: valóban előkerülnek-e azok a bizonyos, évek óta eltitkolt levelezések, amelyek végleg eldöntik a bírósági pert.

2025, adminboss, arstechnica.com alapján

  • Te mit gondolsz, mennyire helyes egy cég részéről, hogy titkolja a belső kommunikációt egy jogi vita esetén?
  • Te mit tennél, ha a cégeddel kapcsolatban ilyen komoly szerzői jogi vádak merülnének fel?


Legfrissebb posztok

szombat 18:40

Leghaszontalanabb amerikai szlengek és idiómák

“Wallet biopsy” Szó szerint: pénztárca-biopszia 💸, amikor egy orvos vagy egészségügyi szolgáltató előbb ellenőrzi 🔬, mennyi pénzed / biztosításod van, és aztán dönti el, milyen vizsgálatot kapsz...

csütörtök 18:24

Penrose szám: A bizonyíték Isten létére?

Sir Roger Penrose brit matematikus és elméleti fizikus, aki a fekete lyukak szingularitásának és az általános relativitáselmélet új matematikai alapjainak feltárásáért kapott Nobel-díjat, az 1970-es években sokkoló, a tudományos világot megosztó tézist közölt...

MA 09:09

A megdöbbentő leleplezés: Edge és Chrome bővítmények 4,3 milliót kémleltek

Évekig rejtőzködő böngészőbővítmények figyelték és támadták meg 4,3 millió Chrome- és Edge-felhasználó számítógépét, hátsóajtót és kémprogramokat telepítve, hogy érzékeny adatokat továbbítsanak kínai szerverekre...

MA 09:03

A nagy áttörés előtt: tényleg közel a HIV funkcionális gyógyítása?

Nehéz elhinni, de világszerte mintegy 40 millió ember él HIV-fertőzéssel. Bár ma már a vírus nem jelent halálos ítéletet, az érintetteknek élethosszig tartó gyógyszeres kezelésre van szükségük egészségük fenntartásához...

MA 08:57

Az Nvidia újabb 730 milliárddal turbózza a GPU-forradalmat

🚀 Az Nvidia 730 milliárd forintot (2 milliárd dollárt) fektetett a chiptervező óriás, a Synopsys részvényeibe, hogy a GPU-kat nélkülözhetetlenné tegye a tervező- és szimulációs szoftverekben...

MA 08:45

Az intersztelláris üstökösön elszabadultak a jeges vulkánok

💨 Kezdetben az üstökösök csupán titokzatos vándoroknak tűntek, ám most mindenkit meglepett, amit a 3I/ATLAS jelű intersztelláris üstökösről kiderült...

MA 08:29

Az Instagram visszarendeli a dolgozókat – tényleg vége a home office-nak?

💻 2026 februárjától az Instagramnál dolgozók heti öt napot töltenek az irodában...

MA 08:22

Az internetes tanúsítványok érvényessége vészesen rövidül

Let’s Encrypt, a világ egyik legnagyobb hitelesítésszolgáltatója hamarosan jelentősen lerövidíti az általa kiadott tanúsítványok érvényességi idejét...

MA 08:16

Az új hárompaneles szenzáció: mindjárt itt a Galaxy Z TriFold

A Samsung bemutatta legújabb csúcsmodelljét, a várva várt Galaxy Z TriFoldot...

MA 08:01

Távozik az Apple MI-vezére, új sztárkutató érkezik

John Giannandrea, az Apple gépi tanulási és MI-stratégiáért felelős alelnöke távozik pozíciójából, és 2026 tavaszán visszavonul...

MA 07:57

Az első nagy áttörés: már felismerjük, ha téved a kvantumszámítógép

A kvantumszámítógépek hosszú évek óta ígérik, hogy megoldják azokat a problémákat is, amelyekre még a legerősebb hagyományos gépek is csak évmilliók alatt adnának választ...

MA 07:51

A sötét webtől a hamis Wi‑Fi-ig: bukott a három kontinensen működő bűnszervezet

Kezdetben négy embert vettek őrizetbe Dél-Koreában, akik több mint 120 000 hálózati IP-kamerát törtek fel...

MA 07:45

Az illegális ritkaföldfém-bányászat pusztulásba taszítja Mianmart

🚨 Mianmar keleti határvidékein, különösen a kínai határ menti Shan államban, hatalmas léptékben zajlik az ellenőrizetlen ritkaföldfém-bányászat, amely már súlyos károkat okozott a környezetben és a helyi közösségekben...

MA 07:36

Az Nvidia új MI-megoldásokkal rohamozza az önvezetés piacát

Az Nvidia új, nyílt MI-modelleket és fejlesztői eszközöket mutatott be, amelyek célja, hogy áttörést hozzanak a robotika és az önvezető járművek területén...

MA 07:22

Az amerikai techcégek Fülöp-szigeteki munkásokkal tréningelik MI-jüket

Flock, az automatikus rendszámtábla-leolvasó és MI-alapú kamera­rendszereiről ismert vállalat, külföldi alkalmi dolgozókat alkalmazza MI-jének betanítására...

MA 07:16

A Marson életet mentő baktériumok forradalmasíthatják az építkezést

Az emberiség évtizedek óta álmodik arról, hogy egyszer saját lábára álljon idegen bolygón...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 12/2

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     LUCH: Photo Effects & Filters (iPhone/iPad)A LUCH Films egy modern fotóalkalmazás, amely képeidet filmes, analóg stílusú szerkesztésekké alakítja át...

MA 07:09

A beszélő asszisztens megérkezett: itt a kínai „A nő” telefon

December 1-jén Kínában bemutatkozott egy új MI-hangasszisztens okostelefonokra, amely már nemcsak egy egyszerű alkalmazás, hanem inkább egy személyi titkárhoz hasonlóan működik...

MA 07:02

A Glassworm visszatért: fertőzött VS Code-bővítmények árasztják el a piacot

🐛 A Glassworm nevű kártékony szoftver ismét támadásba lendült: legutóbb 24 új bővítmény jelent meg az OpenVSX és a Microsoft Visual Studio Marketplace felületein...