2025. 12. 02., 08:38

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar
Az OpenAI nehéz helyzetbe került, miután kénytelen lehet magyarázatot adni arra, miért törölte azokat az adathalmazokat, amelyeket engedély nélkül, kalózkönyvekből állított össze. Az ügy tétje óriási: ha a szerzők bebizonyítják, hogy az OpenAI jogsértő módon használta fel a műveiket a ChatGPT betanítása során, akár milliárdos büntetésre is számíthat a cég.

Kalóz könyvadatok: a vitatott Books 1 és Books 2 adathalmazok

A történet középpontjában két adathalmaz áll: a Books 1 és a Books 2, amelyeket még 2021-ben készítettek volt OpenAI-munkatársak. Ezekhez főként a LibGen (Library Genesis) nevű árnyékkönyvtárból származó, jogtalanul terjesztett műveket használtak fel. Bár az OpenAI szerint ezek az adathalmazok már 2021-ben kikerültek a használatból, és törölték őket még a ChatGPT 2022-es bemutatása előtt, sok szerző gyanítja, hogy ennél többről van szó.

A szerzők különösen gyanússá találták, hogy az OpenAI többször ellentmondott saját magának a törlés okairól. Előbb azt állították, a használat hiánya miatt törölték az adatokat, majd később minden, a törléshez fűződő magyarázatukat ügyvédi titoktartás mögé rejtették.

Bírósági nyomás alatt az OpenAI: ki kell adni a belső leveleket

Egy amerikai szövetségi bíró, Ona Wang úgy döntött, hogy az OpenAI-nak ki kell adnia minden olyan belső kommunikációt, amely a könyvadathalmazok törléséről szól, és amelyben a cég jogászai is érintettek. Wang megállapítása szerint az OpenAI nem titkolhatja el a törlési indokokat pusztán néhány szó kitakarásával vagy azzal, hogy az ügyvédi titoktartásra hivatkozik.

Az OpenAI azért is nehéz helyzetbe került, mert a bíró szerint, ha egy érvet vagy indokot – például a használat hiányát – már korábban közölt, akkor utólag nem nyilváníthatja titkossá, csak azért, hogy elkerülje a bírósági vizsgálatot. A vállalat december 8-ig köteles kiadni a kapcsolódó üzeneteket, és a bíróság a jogászaikat is beidézheti.

Továbbra is az a kérdés, hogy az OpenAI valóban azért törölte-e az adathalmazokat, mert felmerült a jogsértés gyanúja. Ugyanis ha a cég tudatosan próbálta eltitkolni a szerzői jogsértést, az súlyosbító körülmény lehet.

A szerzői jogi per tétje: szándékosan történt-e a kalózkodás

Egy szerzői jogi perben akár 150 000 USD (körülbelül 54 millió forint) kártérítést is megítélhetnek minden egyes jogsértett mű után, ha bebizonyosodik a szándékosság. A felperesek már azt is felvetették: elképzelhető, hogy az OpenAI csak átkeresztelte az adathalmazokat, és a jogi kockázat miatt papíron törölte őket, miközben tovább használja a tartalmakat.

A bíró azt is szóvá tette, hogy az OpenAI magát „jóhiszeműnek” állítja be, miközben ezt a védekezését próbálja eltüntetni a hivatalos iratokból. Az ilyen ellentmondásos lépések tovább erősítették a szerzők azon igényét, hogy betekinthessenek a belső üzenetváltásokba, amelyek kulcsfontosságúak lehetnek a jogsértés szándékosságának bizonyításához.


Bukdácsoló védekezés: téves hivatkozások, jogi csavarok

Az OpenAI jogászai utólag úgy próbálták értelmezni a bírói döntéseket, mintha azok igazolnák a könyvkalózkodási gyakorlat jogszerűségét – például arra hivatkoztak, hogy ha egy kalózmásolatot kizárólag MI‑tréningre használnak, az nem jogsértő. A bíró azonban világossá tette: az ilyen másolatok használata, még azonnali törlésük esetén is, egyértelműen jogellenes.

Következésképpen az OpenAI nagyot kockáztatott azáltal, hogy nem adta ki időben a belső kommunikációt, amellyel egyértelműsíthette volna a szándékosság vagy a jóhiszeműség kérdését. Ez a stratégia akár vissza is üthet: a bíróság szemében a védekezés alapját aknázhatja alá, ha a cég a jogi tanácsadásra hivatkozva egyszerre próbál érvelni és titkolózni.

Döntő lehet az ex-munkatárs tanúvallomása

A szerzők különösen kulcsfontosságúnak tartják, hogy tanúként hallgassa meg a bíróság az Anthropic MI‑cég jelenlegi vezérigazgatóját, Dario Amodeit, aki annak idején az OpenAI-nál felelt a vitatott adathalmazok létrehozásáért. Amodeinek információi lehetnek arról is, miként „semmisítették meg” valójában az adatbázisokat. Az OpenAI megpróbálta megakadályozni a tanúvallomását, de a bíróság végül a szerzőknek adott igazat.

Következésképpen az OpenAI számára nagy veszélyt rejt, hogy Amodei tanúvallomása vagy a kiadott belső üzenetváltások akár terhelő bizonyítékokat szolgáltathatnak a jogsértés szándékosságáról.

Mi jöhet most? Továbbra is lóg a levegőben a hatalmas kártérítés

Az, hogy az OpenAI az ügyvédi titoktartás mögé rejtőzik, és közben cáfolja a tudatos szerzői jogsértést, hosszú távon alááshatja a védekezését. A bíróság számára kulcsfontosságú lesz, hogy betekintést nyerjen az adathalmazok törlésével kapcsolatos levelezésekbe, a stratégia indítékaiba és a cég valódi szándékaiba.

Következésképpen, ha kiderül, hogy az OpenAI pontosan tudta: törvénybe ütköző volt a kalózkönyvek használata, és csak a lebukástól tartva törölték papíron az adatokat, akár példátlan összegű büntetés is kiszabható lehet rájuk. Már csak az a kérdés: valóban előkerülnek-e azok a bizonyos, évek óta eltitkolt levelezések, amelyek végleg eldöntik a bírósági pert.

2025, adminboss, arstechnica.com alapján

  • Te mit gondolsz, mennyire helyes egy cég részéről, hogy titkolja a belső kommunikációt egy jogi vita esetén?
  • Te mit tennél, ha a cégeddel kapcsolatban ilyen komoly szerzői jogi vádak merülnének fel?


Legfrissebb posztok

MA 16:01

A napi valódi kávé távol tarthatja a demenciát

Sokan érzik úgy, hogy a napi kávé vagy tea élesíti az elmét – és most ezt tudományosan is alátámasztják...

MA 15:55

Az új Pixel 10a és a nagy FaceTime-félreértés

A Google hivatalosan is megerősítette, hogy a Pixel 10a február 18-án előrendelhetővé válik, és kiemelte, hogy ez lesz eddig a legstrapabíróbb Pixel A-szériás modell...

MA 15:38

Az elhízás elleni gyógyszerháborúban perel a Novo Nordisk riválisát

💉 Az Ozempic és a Wegovy készítményeiről ismert Novo Nordisk jogi lépéseket tett a rivális Hims & Hers ellen az Egyesült Államokban, mert szerinte veszélyes, hamisított fogyókúrás gyógyszereket árusít...

MA 15:02

Az elhízás jelentősen növeli a súlyos fertőzések kockázatát

Erre utal többek között az, hogy egy friss, nagyszabású kutatás szerint azok, akik elhízottak, jelentősen nagyobb arányban kerülnek kórházba, illetve halnak meg különféle fertőzések miatt, legyen szó vírusokról, baktériumokról, gombákról vagy parazitákról...

MA 14:56

Az Aadhaar tarol: igazolvány helyett app, az aggályok maradnak

🛠 India most minden eddiginél mélyebben igyekszik beépíteni az Aadhaar lakossági digitális azonosítórendszert a mindennapi életbe...

MA 14:37

Az igazi verseny kezdődik? Lazít az Apple és a Google az appboltokon

Az Egyesült Királyság versenyhivatali fellépése miatt az Apple és a Google kénytelen lesz módosítani alkalmazásáruházaik működését...

MA 14:19

A világ legtisztább égboltjai megmenekültek – fellélegezhetnek a csillagászok

A chilei égbolt tisztaságát évtizedek óta a világ vezető csillagászai figyelik...

MA 13:55

Az évszázad kriptócsalása: 20 év börtön a vezérnek

Egy kínai és Saint Kitts és Nevis-i állampolgárságú férfit távollétében húsz év börtönre ítéltek, amiért részt vett egy nemzetközi, úgynevezett „pig butchering” (szerelmi csalás) típusú kriptovaluta-befektetési átverésben, amellyel több mint 26 milliárd forintot (73 millió USD) csaltak ki áldozatoktól...

MA 13:19

Az MI orvosi tanácsa csak egy Google-kereséssel ér fel

Az MI-chatbotok villámgyors fejlődése ellenére az egészségügyi szakértők szerint nem alkalmasak valódi orvosi tanácsadásra...

MA 13:02

Az ADHD-kezelések kulisszatitkai: mi válik be, mi nem?

💡 Az ADHD világa sokszor zavaros: egymásnak ellentmondó ajánlások, bizonytalan hatású módszerek és éveken át tartó találgatás nehezítette a döntést orvosoknak és érintetteknek egyaránt...

MA 12:55

Az Alibaba áttörése: MI-jük már robotokat is irányít

🤖 A kínai Alibaba bemutatta legújabb mesterségesintelligencia-modelljét, a RynnBrain-t, amelyet kifejezetten robotok számára fejlesztettek...

MA 12:38

A pofonegyszerű jelszólopás: amikor még MI sem kell

Egy lényeges szempont, hogy a jelszavak mindig is feszültséget jelentettek a felhasználói élmény és a biztonság között...

MA 12:19

Itt az Aluminum OS, a Google új MI-alapú platformja

A Google nagy dobásra készül: az Aluminium OS-sel egyesíti a Chrome OS-t és az Androidot, így egy közös, számítógépekre szánt rendszert hoz létre...

MA 11:56

Az Instagram és a YouTube szándékosan tesz minket függővé?

👀 Az Instagram és a YouTube tulajdonosait azzal vádolják, hogy szándékosan olyan “függőséggyárakat” hoztak létre, amelyek a gyerekek mentális egészségét veszélyeztetik...

MA 11:19

Az anyag szerkezete szabja meg a kvantumidő ritmusát

⚙ Az idő a hétköznapi érzékelésünk szerint folyamatosan áramlik, de a kvantumszinten egészen másképp viselkedik...

MA 10:58

A valóságon túl: több mint öt érzékünk van

Az emberek a világot nem elkülönült érzékeken keresztül tapasztalják. Szaglás, tapintás, hallás, látás és egyensúlyérzék folyamatosan hatnak egymásra, befolyásolják, hogyan érezzük az ételek ízét, a tárgyak textúráját vagy akár azt is, hogy testünk mennyire tűnik nehéznek...

MA 10:49

A Ring új frissítése mindent lát – így kapcsolhatod ki

A Ring legújabb funkciója, a Search Party, igazi nagy durranással jelent meg a Super Bowl-reklámok között, ám a vártnál jobban megijesztette az embereket: a tömeges, MI-alapú megfigyelés már nemcsak a sci-fi filmekben létezik...

MA 10:41

A mesterséges intelligencia percek alatt lebuktatja a csalókat: így véd a bank

Egy lényeges szempont, hogy a banki csalásvédelem mára olyan tempót és pontosságot követel meg, amely elképzelhetetlen lenne emberi beavatkozás mellett...

MA 10:33

Az idei tél markában: miért fagyunk még mindig?

Az Egyesült Államok keleti részén január óta szokatlanul hideg az idő – a hőérzet gyakran mínusz 25–30 Celsius-fok körül alakul, miközben a nyugati államokban rendkívüli meleg uralkodik...

MA 10:25

Az ismeretlen hacker a SolarWinds WHD adminjogaira vadászik

🔐 Decemberben egy ismeretlen támadó több SolarWinds Web Help Desk (WHD) rendszeren keresztül jutott be különböző szervezetek hálózataiba, ahol oldalirányú mozgással magas szintű hozzáférést biztosító hitelesítő adatokat szerzett...

MA 10:01

Az elektromos autók valóban tisztább levegőt hoznak?

A kaliforniai levegő érezhetően tisztul, ahogy egyre több elektromos autó és plug-in hibrid veszi át a hagyományos benzin- és dízelautók helyét...

MA 09:59

A Discord-botrány: kiszivárgott igazolványok, jön a kötelező korellenőrzés

Felmerül a kérdés, hogy biztonságban vannak-e az adataink a Discordon, ahol nemrég 70 000 felhasználó személyi igazolványa került illetéktelen kezekbe...

MA 09:49

A Super Bowl-reklám után azonnal a bankkártyádra hajt az AI.com

💵 Az AI.com nevű új oldal hatalmas feltűnést keltett a Super Bowl alatt sugárzott reklámjával, amelyre állítólag 30 milliárd forintot költöttek...

MA 09:42

A texasi nap turbózza az MI-t: a Google 1 gigawattnyit vásárol

☀ A Google hatalmas, 68 000 milliárd forintos (185 milliárd dolláros) beruházásra készül 2026-ban: új adatközpontokkal árasztja el a világot, amelyek a legfejlettebb MI-gyorsítókkal működnek majd...

MA 09:33

A nagy szingapúri telekomcégeket kínai hekkerek támadták meg

Szingapúr négy legnagyobb távközlési szolgáltatóját – a Singtel-t, a StarHub-ot, az M1-et és a SIMBA-t – legalább egyszer sikeresen feltörte a kínai UNC3886 kémcsoport 2024-ben...

MA 09:25

Az újabb Google-húzás: fizetősek lesznek a dalszövegek a YouTube Musicon

Nagyot húzott a Google: sok felhasználó hamarosan csak fizetős előfizetéssel érheti el a dalszövegeket a YouTube Musicon...

MA 09:17

Az ipari deepfake-átverések betörtek a mindennapjainkba

A deepfake-technológia fejlődésének köszönhetően ma már bárkinek lehetősége van profi, megtévesztő videókat és hanganyagokat készíteni, amelyekkel pénzt csalnak ki gyanútlan áldozatoktól...

MA 09:09

A Google Fordító mostantól beszélget is, nemcsak fordít

💬 A Google Fordítónak eddig egyetlen feladata volt: bemásolsz egy szöveget, ő pedig lefordítja...

MA 09:02

A MI-fejlesztők pórul jártak: saját hibájuk vitte a SmarterTools-csapdába

⚠ Az amerikai SmarterTools cég hálózatát a Warlock nevű zsarolóvírus-csoport törte fel egy olyan sebezhetőség révén, amely saját levelezőszoftverükben, a SmarterMailben volt...