2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 09:15

Az Ultramarine-ok közé tényleg keveredett egy Halo-elit?

😱 Egy igazi rajongó, Skykillerr nevű művész szétmodolta a Warhammer 40,000: Space Marine 2-t: konkrétan játszhatóvá tette benne a Halo-sorozatból ismert félelmetes fehér Elite-et (Ultra, Halo: Reach), és erről egy menő videót is feltöltött...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     RPG Knights of Grayfang (iPhone/iPad)Eldraad egy varázslatos, fantáziadús világ, ahol ember és szörny évszázados háborút vív egymással...

MA 09:08

Az afrikai kontinens kettészakadása gyorsabb, mint hittük

A kelet-afrikai Turkana-árok kétségtelenül híres az emberiség egyik leggazdagabb fosszíliálelet-anyagáról, miközben állandó vulkáni aktivitás jellemzi a területet...

MA 09:01

Az amerikai bitcoin-ETF-ek uralmuk alá hajtják a kriptopiacot

Pénteken áttörés történt az amerikai bitcoin-derivatívák piacán: a BlackRock által menedzselt bitcoin-tőzsdén kereskedett alap (ETF), az IBIT opcióinak piaci mérete elérte, sőt meghaladta a külföldi Deribit opciós piacáét...

MA 08:56

Az agresszív gyíkok felfalják a természet színeit

Tipikus eset, amikor az evolúció szépen, egyensúlyban működik évmilliókig – aztán hirtelen minden felborul...

MA 08:50

Az új Strands: egy vita, ami mindenkit beszippant

🤔 A vasárnapi Strands rejtvény elsőre tréfásan könnyű témát ígért: „Merülj bele” (Get into it)...

MA 08:43

A legújabb kutatás szerint a halolaj árthat az agyadnak

🐞 Az utóbbi években egyre többek kezében tűnik fel valamilyen halolaj-kiegészítő, főleg azok körében, akik szeretnének vigyázni agyuk egészségére...

MA 08:35

Az alaszkai lazac vesztét hozhatják az invazív csukák

Alaszka folyóinak felmelegedése újabb problémát hozott magával: az invazív északi csuka egyre falánkabbá válik...

MA 08:29

Az NYT Connections legújabb trükkjei: így győzd le a rejtvényt

📚 Érdemes látni, mennyire képes meglepni a Connections, a New York Times egyre népszerűbb szójátéka...

MA 08:22

Az életmentő grafén: baktériumölő csoda, emberre nézve veszélytelen

💡 A mindennapi életben számos olyan tárgy vesz körül minket – ruhák, maszkok, fogkefék –, amelyek közvetlenül érintkeznek a testünkkel, így kiemelten fontos a higiénia...

MA 08:01

Az univerzum titkos kohói: gravitációs hullámokból születhetett a sötét anyag

Az Ősrobbanás utáni kaotikus pillanatokban a téridő fodrozódásai többet jelenthettek, mint puszta hullámok: lehet, hogy ezeknek köszönhetjük a galaxisokat összetartó titokzatos sötét anyagot is...

MA 07:57

Az új Michael Jackson-film: táncra perdül a nézőtér, vagy égés?

A moziban ülők most nemcsak pattogatott kukoricáért ugranak fel, hanem a Michael (Michael) című életrajzi film alatt tényleg táncra is perdülnek!..

MA 07:50

Az MI-ügynökök letarolják a kriptót: az ember háttérbe szorul

A modern pénzügyi rendszer mindig is az emberi élet igényeihez igazodott: országhatárokhoz, papírmunkához, banki nyitvatartáshoz...

MA 07:29

Az MI új támadáshullámot szabadított a kriptovilágra

A decentralizált pénzügyi világban (DeFi) évekig a figyelem középpontjában az okosszerződés-hibák álltak...

MA 07:22

Az Assassin’s Creed: Fekete Zászló adaptációja nem spórol a vérrel

🏴 Az Assassin’s Creed: Fekete Zászló (Black Flag) Resynced bejelentése után sok rajongó felkapta a fejét: eltűnt a jól ismert vér, helyette színes szikrák jelentek meg a harcokban...

MA 07:15

Az év washingtoni politikai divatparádéja, amiért Hollywood is rajong

👑 Csak éppen közben mindenki a ruhákat nézi – a 2026-os Fehér Ház tudósítói vacsorája (White House Correspondents’ Dinner) szombat este igazi vörös szőnyeges forgataggá változtatta Washington D...

MA 07:07

A tömeg rejtélye: a különleges részecske nyomában

Egy nemzetközi kutatócsoport most először talált bizonyítékot egy eddig csak elméletben feltételezett különleges állapot, az úgynevezett mezonikus atommag létezésére...

MA 07:01

Az idegek harca: így győzhetsz vasárnap a Quordle-ben

🤔 A Quordle mára igazi kihívást jelent, hiszen egyszerre négy szót kell megfejteni...

MA 06:57

Az IKEA 40 éves: a bútorok, amelyek meghódították otthonainkat

Negyvenéves az IKEA! Ünneplésképp a svéd bútoróriás összegyűjtötte legikonikusabb darabjait – fogadjunk, hogy legalább egy közülük ott lapul nálad is...

MA 06:50

Az elátkozott katonák: a Fallout: New Vegas legbizarrabb befejezése

☠ A döntések jelentősége a szerepjátékokban sokszor jóval túlmutat a fő történeten...

MA 06:44

A megállíthatatlan zöld forradalom: merre tart a bolygónk?

🌱 Erre utal többek között az, hogy a klímatudósok szerint már biztosan lecsúsztunk arról, hogy az ipari forradalom előtti szinthez képest 1,5 Celsius-fokon tudjuk tartani a globális átlaghőmérséklet-emelkedést...

MA 06:36

Az idei London Marathon élőben: itt nézheted

🏃 A világ egyik legrangosabb futóversenyén ismét hatalmas izgalmak várhatók, hiszen a 2026-os londoni maratonon közel 60 ezren rajtolnak el a brit főváros legendás útvonalán, Greenwich-től egészen a The Mall-ig, elhaladva a híres Cutty Sark mellett...

MA 06:29

A miniszterelnök is rajong érte: a Crimson Desert az új király

A Crimson Desert szinte robbanásszerűen hódította meg a koreai és a nemzetközi játékvilágot, hiszen a megjelenés utáni 26 napon belül már 5 millió példányt adtak el belőle világszerte...

MA 06:22

A bélflóra rejtheti a depresszió titkos kulcsát

🤰 Az utóbbi években egyre több bizonyíték utal arra, hogy a bélben élő mikrobák nemcsak az emésztésünkben, hanem az agyunk működésében is fontos szerepet játszanak...

MA 06:05

Történelmi események a mai napon (Április 26.)

Évfordulók, amelyek átformálták a világot: Guernica bombázása, a bangladesi tornádó, a tanzániai egyesülés és a pekingi tavasz szikráját adó szerkesztőségi cikk mind ezen a napon történt...

MA 06:01

Az egyszerű szemvizsgálat, amely megjósolja, meddig élsz?

Haldoklók esetében gyakran felmerül a kérdés: még mennyi időt tölthet együtt a család?..

szombat 21:45

Felpörgött a botrány az aranyáron forgatott Michael-életrajzi film körül

🎥 A Michael Jackson életét feldolgozó új film készítése során egy váratlan jogi hiba okozott feszültséget és hatalmas többletkiadásokat...

szombat 21:12

Az új Bitcoin-pánik: Jön a 14 milliós zuhanás?

Bár a Bitcoin idén 15 százalékot erősödött, és mostanában 78 ezer dollár (kb...

szombat 21:01

Az Epic berobbantotta a Fortnite legdurvább shotgun-őrületét

🔫 Érdekes felvetés, hogy meddig lehet fokozni a fegyverválasztékot egy battle royale játékban úgy, hogy az még élvezhetőbbé tegye az élményt...