
Kalóz könyvadatok: a vitatott Books 1 és Books 2 adathalmazok
A történet középpontjában két adathalmaz áll: a Books 1 és a Books 2, amelyeket még 2021-ben készítettek volt OpenAI-munkatársak. Ezekhez főként a LibGen (Library Genesis) nevű árnyékkönyvtárból származó, jogtalanul terjesztett műveket használtak fel. Bár az OpenAI szerint ezek az adathalmazok már 2021-ben kikerültek a használatból, és törölték őket még a ChatGPT 2022-es bemutatása előtt, sok szerző gyanítja, hogy ennél többről van szó.
A szerzők különösen gyanússá találták, hogy az OpenAI többször ellentmondott saját magának a törlés okairól. Előbb azt állították, a használat hiánya miatt törölték az adatokat, majd később minden, a törléshez fűződő magyarázatukat ügyvédi titoktartás mögé rejtették.
Bírósági nyomás alatt az OpenAI: ki kell adni a belső leveleket
Egy amerikai szövetségi bíró, Ona Wang úgy döntött, hogy az OpenAI-nak ki kell adnia minden olyan belső kommunikációt, amely a könyvadathalmazok törléséről szól, és amelyben a cég jogászai is érintettek. Wang megállapítása szerint az OpenAI nem titkolhatja el a törlési indokokat pusztán néhány szó kitakarásával vagy azzal, hogy az ügyvédi titoktartásra hivatkozik.
Az OpenAI azért is nehéz helyzetbe került, mert a bíró szerint, ha egy érvet vagy indokot – például a használat hiányát – már korábban közölt, akkor utólag nem nyilváníthatja titkossá, csak azért, hogy elkerülje a bírósági vizsgálatot. A vállalat december 8-ig köteles kiadni a kapcsolódó üzeneteket, és a bíróság a jogászaikat is beidézheti.
Továbbra is az a kérdés, hogy az OpenAI valóban azért törölte-e az adathalmazokat, mert felmerült a jogsértés gyanúja. Ugyanis ha a cég tudatosan próbálta eltitkolni a szerzői jogsértést, az súlyosbító körülmény lehet.
A szerzői jogi per tétje: szándékosan történt-e a kalózkodás
Egy szerzői jogi perben akár 150 000 USD (körülbelül 54 millió forint) kártérítést is megítélhetnek minden egyes jogsértett mű után, ha bebizonyosodik a szándékosság. A felperesek már azt is felvetették: elképzelhető, hogy az OpenAI csak átkeresztelte az adathalmazokat, és a jogi kockázat miatt papíron törölte őket, miközben tovább használja a tartalmakat.
A bíró azt is szóvá tette, hogy az OpenAI magát „jóhiszeműnek” állítja be, miközben ezt a védekezését próbálja eltüntetni a hivatalos iratokból. Az ilyen ellentmondásos lépések tovább erősítették a szerzők azon igényét, hogy betekinthessenek a belső üzenetváltásokba, amelyek kulcsfontosságúak lehetnek a jogsértés szándékosságának bizonyításához.
Bukdácsoló védekezés: téves hivatkozások, jogi csavarok
Az OpenAI jogászai utólag úgy próbálták értelmezni a bírói döntéseket, mintha azok igazolnák a könyvkalózkodási gyakorlat jogszerűségét – például arra hivatkoztak, hogy ha egy kalózmásolatot kizárólag MI‑tréningre használnak, az nem jogsértő. A bíró azonban világossá tette: az ilyen másolatok használata, még azonnali törlésük esetén is, egyértelműen jogellenes.
Következésképpen az OpenAI nagyot kockáztatott azáltal, hogy nem adta ki időben a belső kommunikációt, amellyel egyértelműsíthette volna a szándékosság vagy a jóhiszeműség kérdését. Ez a stratégia akár vissza is üthet: a bíróság szemében a védekezés alapját aknázhatja alá, ha a cég a jogi tanácsadásra hivatkozva egyszerre próbál érvelni és titkolózni.
Döntő lehet az ex-munkatárs tanúvallomása
A szerzők különösen kulcsfontosságúnak tartják, hogy tanúként hallgassa meg a bíróság az Anthropic MI‑cég jelenlegi vezérigazgatóját, Dario Amodeit, aki annak idején az OpenAI-nál felelt a vitatott adathalmazok létrehozásáért. Amodeinek információi lehetnek arról is, miként „semmisítették meg” valójában az adatbázisokat. Az OpenAI megpróbálta megakadályozni a tanúvallomását, de a bíróság végül a szerzőknek adott igazat.
Következésképpen az OpenAI számára nagy veszélyt rejt, hogy Amodei tanúvallomása vagy a kiadott belső üzenetváltások akár terhelő bizonyítékokat szolgáltathatnak a jogsértés szándékosságáról.
Mi jöhet most? Továbbra is lóg a levegőben a hatalmas kártérítés
Az, hogy az OpenAI az ügyvédi titoktartás mögé rejtőzik, és közben cáfolja a tudatos szerzői jogsértést, hosszú távon alááshatja a védekezését. A bíróság számára kulcsfontosságú lesz, hogy betekintést nyerjen az adathalmazok törlésével kapcsolatos levelezésekbe, a stratégia indítékaiba és a cég valódi szándékaiba.
Következésképpen, ha kiderül, hogy az OpenAI pontosan tudta: törvénybe ütköző volt a kalózkönyvek használata, és csak a lebukástól tartva törölték papíron az adatokat, akár példátlan összegű büntetés is kiszabható lehet rájuk. Már csak az a kérdés: valóban előkerülnek-e azok a bizonyos, évek óta eltitkolt levelezések, amelyek végleg eldöntik a bírósági pert.
