2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 09:27

A japánok valódi eredete: óriási DNS-felfedezés átírja a történelmet

Évszázadokon át általános volt a nézet, hogy a japán lakosság elsősorban két ősi népcsoport, a szigetcsoportban évezredek óta élő Jomon vadászó-gyűjtögetők és a később keletről bevándorló, rizstermesztést és új technológiákat meghonosító közösségek leszármazottai...

MA 09:19

A Stardew Valley-ben nem lesz hűtlenség – Nagypapa nem örülne

🌾 A Stardew Valley rajongói között komoly hullámokat kavart, hogy vajon megjelenhet-e valaha a hűtlenség vagy a válás lehetősége a játékban...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/14

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     War Mongrels (iPhone/iPad)A War Mongrels (röviden WM) egy izometrikus nézetű valós idejű taktikai játék, amely a második világháború keleti frontján játszódik...

MA 09:10

A Tejútrendszer felfalta a Loki nevű galaxist – megvannak a maradványai

💫 Több mint tízmilliárd évvel ezelőtt a Tejútrendszer nem arra az égre hasonlított, amit ma ismerünk...

MA 09:02

A Föld ősi szupernóvatörmeléken száguld – bizonyíték az antarktiszi jégben

Földünk egy évezredek óta porladó csillagrobbanás anyagfelhőjén halad keresztül, amelynek radioaktív vasnyomait most mélyen az antarktiszi jégben találták meg a kutatók...

MA 08:56

Az Anthropic visszahozza az OpenClaw-t és a külső ügynököket – de komoly kikötésekkel

🔔 Többek között izgalmas bejelentés rázta meg az MI-fejlesztők világát: ismét lehetőség van az OpenClaw és más, harmadik féltől származó autonóm MI-ügynökök használatára az Anthropic népszerű Claude-előfizetéseinek keretében...

MA 08:46

A 395 ezer dollárnyi bitcoin visszatér: Claude kiszabadítja a gép fogságából

🔑 Majdnem 140 millió forint értékű bitcoin ragadt egy régi számítógépen, de egy váratlan fordulat mindent megváltoztatott...

MA 08:37

A legfejlettebb MI nemcsak töröl, át is ír – és észrevétlenül hibázik

💡 Ahogy a nagy nyelvi modellek egyre okosabbá válnak, egyre többen bízzák rájuk tudásalapú feladatok elvégzését: a gép átnézi, rendszerezi, szerkeszti a dokumentumokat, majd leteszi elénk a kész eredményt...

MA 08:29

A mindennapi kávé 35%-kal csökkentheti a demencia esélyét

Amerikai kutatók több mint 130 000 egészségügyi dolgozót követtek 43 éven át, hogy felmérjék a kávé és tea hosszú távú hatásait az agy egészségére...

MA 08:19

A Warhammer 40,000: Mechanicus 2 jövő héten, a leleplezésekkel teli Skullson debütál

🥂 Erre utal többek között az, hogy a legendás Warhammer Skulls rendezvény idén nemcsak visszahozza a már megszokott izgalmakat, hanem váratlan meglepetéssel is szolgál: a nagy sikerű, körökre osztott taktikai játék, a Warhammer 40,000: Mechanicus 2 már május 21-én, a Skulls eseményén megjelenik...

MA 08:02

Az eddigi legnagyobb és legerősebb Starship indítására készül a SpaceX

🚀 Az űrhajózás történetében ritkán születik akkora izgalom, mint amikor egy vadonatúj, gigászi rakéta készül elhagyni a Földet...

MA 07:46

A Metaplanet halasztja az elsőbbségi részvények tőzsdei debütálását Japánban

A Metaplanet, amely Japán legnagyobb vállalati bitcoin-tulajdonosa és világviszonylatban is a harmadik legnagyobb bitcoin-vagyonkezelő, kénytelen elhalasztani a tervezett Mars és Mercury nevű örökjáradékos preferált részvényeinek tőzsdei bevezetését...

MA 07:38

Az óriás Sony 200–600 G OSS: csoda vagy kompromisszum?

📷 Különösen említést érdemel, hogy a Sony FE 200–600mm f/5.6–6.3 G OSS objektív új szintre emeli a természetfotózást: ha korábban akadály volt a nagy távolság vagy a váratlan mozgás, ezzel az objektívvel minden esélyed megnő az akció tökéletes elkapására...

MA 07:29

A Homo erectus genetikai anyagát először szekvenálták: mély genetikai kapcsolat velünk

🔬 Lényeges, hogy a 400 ezer éves Homo erectus-maradványok elemzése forradalmi áttörést hozott – most először sikerült genetikai anyagot szekvenálni ebből a fajból...

MA 07:19

A gondolkodók játéka: Connections – lásd meg a rejtett kapcsolatokat

Ha szereted a kihívásokat, a Connections nevű szókirakó minden nap új fejtörőt készít neked...

MA 07:10

A Consensys visszakozik: őszre tolódik a tőzsdei debütálás

Felmerül a kérdés, hogy mikor léphet végre tőzsdére a kriptovilág egyik legismertebb szereplője, hiszen a Consensys, a Joe Lubin vezetésével működő Ethereum-alkalmazásfejlesztő vállalat ismét elhalasztotta az amerikai tőzsdére lépését...

MA 07:02

Az MI IQ-láz: emberi skálán mérik, a techvilág szétszakad

Megemlíthető továbbá, hogy évtizedeken át az IQ-teszt számított az egyik legismertebb – és egyben legvitatottabb – mérőszámnak az emberi intelligencia terén...

MA 06:56

Az Alpenglow új korszakot nyithat: már tesztelhető a Solanán

🌅 A Solana hálózat történelmének legnagyobb változása érkezett el az új Alpenglow-frissítéssel, amely mostantól tesztelhető a közösségi teszthálózaton...

MA 06:46

A neandervölgyiek már fogorvoskodtak: 60 ezer éves, fúrt fog Szibériából

Nemcsak az emberiség legkorábbi egészségügyi beavatkozásának, hanem az első, szinte modernnek mondható fogászati kezelésnek a nyomait is felfedezték Szibériában, egy Neander-völgyi ősember hátrahagyott fogán...

MA 06:29

A hadiipar rémálma: ukrán dróngyilkos lézer fillérekből, három mérföldről

Az ukrán Celebra Tech új fejlesztése, a Trident névre keresztelt lézerfegyver forradalmi áttörést ígér a modern hadviselésben...

MA 06:20

Az USA egyre védtelenebb a járványokkal szemben – ki védi az amerikaiakat?

Egy újonnan felbukkant hantavírusos megbetegedés az amerikai közegészségügy védelmi rendszereinek gyengeségeire világított rá...

MA 06:05

Történelmi események a mai napon (Május 14.)

Válogatás a történelem májusi napjának nagy pillanataiból: királygyilkosságok, forradalmi csaták és államalapítások formálták Európát és a világpolitikát...

MA 06:02

A légszennyezés súlyosbíthatja a depressziót és szorongást – kutatások szerint

A világ egyre több pontján derül ki, hogy a szennyezett levegő nemcsak a testnek, hanem az elmének is árt...

szerda 21:56

A tudósok végre megfejtették az abroncsok százéves rejtélyét

A mindennapok egyik legfontosabb anyaga a megerősített gumi, amelynek köszönhetően az autó- és repülőgépgumik elviselik a hatalmas terhelést, ráadásul megtalálható ipari gépekben, egészségügyi eszközökben, sőt, a kerti locsolótömlőkben is...

szerda 21:45

Az MI költözik a kurzor mögé – kell ez nekünk?

🧠 A jól megszokott egérkurzor az évtizedek alatt alig változott, mégis tökéletesen működik – legalábbis eddig így hittük...

szerda 20:22

A telekomóriás KDDI 14,9%-ot vesz a Coincheck Groupban, 65 millió dollárért

💰 A japán KDDI 14,9%-os részesedést szerez a Coincheck Groupban, miután 65 millió dollárért – közel 23,2 milliárd forintért – 28,5 millió új részvényt vásárol részvényenként 2,28 dolláros (kb...

szerda 19:56

Az iPhone Ultra lehet a meglepetéssiker: milliók vennének hajlítható iPhone-t

📱 Az Apple hamarosan piacra dobhatja első hajlítható iPhone modelljét, amit iPhone Ultra néven emlegetnek, és úgy tűnik, ezzel új fejezetet nyithat a mobiltechnológiában...

szerda 19:45

A Surfshark Alternative ID felturbózza az Android 17 hívásvédelmét

📱 Az Android 17 hívószám-hamisítás elleni védelme (Spoofing Protection) váratlanul hasznosnak bizonyul: képes felismerni a csalókat és megszakítani a hívásaikat, még mielőtt megszereznék az érzékeny adatokat...

szerda 19:34

A jégkorszak után 500 évvel korábban tértek vissza Britanniába, mint hittük

🦾 Több mint 15 000 évvel ezelőtt, az utolsó nagy jégkorszak után az emberek a korábban véltnél jóval előbb tértek vissza a brit szigetekre...