Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

vasárnap 19:18

A Samsung tarol az idei CES-en: megjött a nagy bejelentés

🔥 Minden szem a Samsungra szegeződik a 2026-os CES-en, hiszen a techóriás idén is Las Vegasban tartja nagyszabású bemutatóját...

vasárnap 19:02

A Végítélet-gleccser megremeg: földrengéshullám rázza az antarktiszi jégóriást

🌌 Lényeges, hogy a világ egyik legnagyobb jégárja, a Thwaites-gleccser – ismertebb nevén Végítélet-gleccser (Doomsday Glacier) – elképesztő sebességgel veszít tömegéből, és közben százával rázzák meg a jégföldrengések...

vasárnap 18:49

Az MI-botrány: a Grok gyerekekről gyártott szexuális deepfake-eket

Az utóbbi napokban Franciaország és Malajzia is csatlakozott Indiához, elítélve a Grok chatbot működését, amely nők és kiskorúak szexualizált deepfake-képeinek előállítása miatt került a középpontba...

vasárnap 18:33

Az új NotePin S végre kapott egy dedikált gombot

🖋 A Plaud bemutatta a megújult NotePin S-t, az apró, MI-alapú diktafont, amelyet mostantól végre egy fizikai gombbal is felszereltek...

vasárnap 18:17

Itt a Belkin nagy dobása: forradalmi, egyedi kijelzővédők

🛠 A Belkin idén is meglepi a felhasználókat a CES-en, és ezúttal nemcsak új tokokat és power bankeket, hanem teljesen személyre szabható kijelzővédőket is bemutat...

vasárnap 18:01

Az új füles kiszűri a zajt, és helyetted jegyzetel

🗣 Egy feltörekvő MI-cég új vezeték nélküli fülhallgatót mutatott be, amely forradalmasítja a hangalapú jegyzetelést és telefonálást zajos környezetben...

vasárnap 17:50

Az új bankszámla aranyat érhet: akár 4% kamat járhat

💵 Akik manapság spórolni szeretnének, azoknak különösen oda kell figyelniük a kamatokra...

vasárnap 17:34

Az önjáró napelemes robot beköltözteti a jövőt a kertedbe

Jackery, a napelemes megoldások egyik vezető fejlesztője új termékek sorát mutatta be a 2026-os CES-en, amelyek jelentősen átalakíthatják, ahogyan a háztartások és a szabadtéri tevékenységek energiaellátását elképzeljük...

vasárnap 17:18

Az USB három évtizede uralja a csatlakozás világát

🔋 Az USB immár harminc éve segíti eszközeink egyszerű adatátvitelét és tápellátását – ma már elképzelhetetlen nélküle a mindennapi élet, legyen szó otthoni munkáról, irodáról vagy utazásról...

vasárnap 17:02

Az új mémérme-őrület: beindult a Dogecoin

🐶 Az újév első napjai a mémérme-piacon forradalmi hangulatot hoztak: a Dogecoin értéke meredeken, 4,36%-kal emelkedett, elérve a 0,1516 dolláros (nagyjából 55 HUF) szintet...

vasárnap 16:49

A Setét Torony visszatér? Mike Flanagan nem adja fel

Mike Flanagan, aki többször is sikeresen dolgozta fel Stephen King műveit, most minden erejével azon dolgozik, hogy A Setét Torony (The Dark Tower) végre méltó adaptációt kapjon a képernyőn...

vasárnap 16:33

Az okosszemüvegek jönnek: búcsú a mobiloktól?

Az okosszemüvegek több mint tíz éve próbálnak betörni a piacra, de még mindig nem sikerült igazán nélkülözhetetlenné válniuk...

vasárnap 16:17

A Jackery napelemes pavilonja: borsos ár, de zseniális ötlet

Jackery, az otthoni akkumulátorairól ismert márka a CES-en mutatta be legújabb különlegességét, a napelemmel felszerelt pavilont, amely az év végén már Kaliforniában is kapható lesz...

vasárnap 16:01

Az újabb vérfürdő: fegyveresek megrohamoztak egy nigériai falut

🚨 Legalább harminc embert öltek meg fegyveresek Észak-Nigériában, Niger államban, miközben többeket elraboltak a szombat esti támadás során...

vasárnap 15:49

A Govee új okoslámpái fényjátékká változtatják a mennyezetet

A Govee ismét feldobja az otthoni világítást, ezúttal a mennyezetet célozza meg legújabb okoslámpáival...

vasárnap 15:34

A legvadabb, mégis természetes macskafajták titkai

😺 Kevesen gondolnák, hogy a világ mintegy 400 millió macskájából kevesebb mint egy százalékuk tartozik konkrét fajtához...

vasárnap 15:17

Az MSX visszatér: egy filléres fejlesztőkészlet kelti életre a legendát

A nyolcvanas években elképesztő mennyiségű otthoni számítógép létezett, mindenféle méretben és rendszerrel, de ezek szinte egyáltalán nem működtek együtt...

vasárnap 14:50

A hagyományos ébresztők gyötörnek? A napfelkelte-órák mosolyra ébresztenek.

Sokan már reggel stresszesek lesznek a harsány, rideg ébresztőktől vagy a telefon visító hangjától...

vasárnap 14:35

Az MI‑lufi kipukkan? A Fed és a globális piacok 2026-ban

2026-ra a világgazdaság és a tőzsdék kilátásait a mesterséges intelligencia körüli bizonytalanság, a jegybanki vezetőcserék okozta aggodalmak és a kockázatos magánhitelezés miatti félelmek uralják...