2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

szombat 21:45

Felpörgött a botrány az aranyáron forgatott Michael-életrajzi film körül

🎥 A Michael Jackson életét feldolgozó új film készítése során egy váratlan jogi hiba okozott feszültséget és hatalmas többletkiadásokat...

szombat 21:12

Az új Bitcoin-pánik: Jön a 14 milliós zuhanás?

Bár a Bitcoin idén 15 százalékot erősödött, és mostanában 78 ezer dollár (kb...

szombat 21:01

Az Epic berobbantotta a Fortnite legdurvább shotgun-őrületét

🔫 Érdekes felvetés, hogy meddig lehet fokozni a fegyverválasztékot egy battle royale játékban úgy, hogy az még élvezhetőbbé tegye az élményt...

szombat 20:56

Az MI-ügynökök forradalmasíthatják a kriptós fizetéseket

🪙 Felmerül a kérdés, hogy miként változtatja meg az online fizetéseket a rohamtempóban fejlődő mesterséges intelligencia...

szombat 20:34

A legújabb őrület: veszélyes szemszínműtétekért rajonganak a fiatalok

Az arcuk tökéletesítésére törekvő fiatal férfiak körében új, kockázatos jelenség terjed: van, aki lézeres beavatkozással próbál világoskék szemet szerezni...

szombat 20:23

A folyamatos frissítések kora visszaüt: Túl sok, túl gyors a WoW?

⚠ Megemlíthető továbbá, hogy a World of Warcraft pár éve gyakorlatilag a feltámadását élte át, miután a Shadowlandset követő kudarc a szakadék szélére taszította...

szombat 20:12

A Fehér Ház árnyékában az év Grindr-bulija megrengeti Washingtont

Na most kapaszkodj, mert péntek este Washingtonban tényleg a Grindr-parti volt a legmenőbb helyszín – még a legendás app felhasználói is irigykedtek azokra, akik bejutottak!..

szombat 20:02

Az Asus Zenbook A14 megveri a MacBook Airt?

💪 A Zenbook A14 minden eddiginél könnyebb és vékonyabb kivitellel igyekszik elcsábítani azokat, akik számára a hordozhatóság az elsődleges szempont...

szombat 19:56

Az iPhone 18 Pro nagy dobásai és színei: mire számíthatsz?

Az idei iPhone 18 Pro minden eddiginél nagyobb érdeklődés középpontjába került...

szombat 19:34

Az igaz szerelem is megbicsaklik: szakított a Szerelem a spektrumon sztárpárja

Van, hogy még a legösszeillőbbnek tűnő páros is külön utakon folytatja – most épp Tina Zhu Xi Caruso és Pari Kim döntött úgy, hogy vége...

szombat 19:23

Az FA-kupa-elődöntő, ahol a Man City megint hengerelhet

🏆 A Wembley Stadionban igazi rangadó vár a szurkolókra, ahol a Manchester City a Championship élcsapatával, a Southamptonnal küzd meg az FA-kupa döntőjébe jutásért...

szombat 19:12

Az európai bankok rákapcsolnak a kriptóra

💰 Az idei év egyik nagy fordulata Belgiumban történt: az ország legnagyobb bankbiztosítója, a KBC bevezette ügyfelei számára a digitális eszközök vásárlásának lehetőségét a jól ismert Bolero brókercég platformján keresztül...

szombat 18:57

Az élő térdprotézis áttörése: búcsú a fém-műanyag korszaknak?

🦶 Érdemes megvizsgálni, hogy a térdprotézis-műtétek terén radikális változás közeleg. Az amerikai Columbia Egyetem és a Missouri Egyetem kutatói új, 3D-nyomtatott implantátumot fejlesztettek, amely élő anyagokat tartalmaz, szemben a hagyományos fém és műanyag protézisekkel...

szombat 18:45

Az MMO-kiegészítők dzsungelében felismered az igazit?

🌲 A masszívan többjátékos online játékok világa elképesztően gyorsan bővül – most őszintén, könyörgöm, észrevetted már, hogy lassan senki sem látja át, hány kiegészítő jelent meg egy-egy címhez?..

szombat 18:23

Az első nagy Fenyegetés-frissítés eltörli a gyűlölt adót

👑 A népszerű Fenyegetés (Menace) körökre osztott taktikai játék első jelentősebb, korai hozzáféréses frissítése végre radikális újításokat hozott...

szombat 15:56

A régi DSLR-ek a vadfotósok titkos aduászai lettek

Ebből következően érdemes megérteni, hogy miért választ egy elismert természetfotós régi, használt DSLR-fényképezőgépeket a modern, tükör nélküli fényképezőgépek helyett...

szombat 15:12

Az Atlanti-áramlat összeomlása ijesztően közel van

Az idei Föld napján nem megnyugtató hírekkel találkoztunk: friss kutatások szerint már jóval közelebb lehetünk az atlanti meridionális áramlási rendszer összeomlásához, mint eddig hittük...

szombat 15:01

Az elveszett Silent Hill 2 forráskódja: egy rajongó kiszabadítja a grafikákat

A Silent Hill 2 forráskódjának elvesztése után szinte lehetetlennek tűnik egy hűséges modernizálás elkészítése...

szombat 14:56

A Helldivers 2 új kiegészítője: acélkolosszusok és brutális fegyverek

🛡 A sci-fi akciójátékban mostantól még nagyobb pusztítást vihetsz véghez az ellenség soraiban, ugyanis az érkező Exo Experts nevű Warbond két vadonatúj exoruhát vezet be...

szombat 14:45

A Soundcore új fejhallgatója mindent elnémít – de megéri az árát?

🔈 Az Anker legfrissebb Soundcore Space 2 fejhallgatója szinte minden helyzetben eltünteti a környezet zavaró hangjait, miközben kényelmes viseletet és okos funkciókat kínál...

szombat 14:34

Az iPhone-hűség rekordot dönt, én mégis Androidot választok

Friss adatok szerint soha nem voltak ennyire lojálisak az iPhone-felhasználók, amikor következő mobiljuk kiválasztásáról van szó: az Egyesült Államokban több mint ötezer ember bevonásával készült felmérés alapján jelenleg a felhasználók 96,4 százaléka ragaszkodna egy újabb iPhone-hoz, és csupán 3,6 százalékuk fontolgatja az átállást Androidra...

szombat 14:25

Az új Polaroid: menő, színes emlékek mobilfotókból egy perc alatt

A digitális korszakban egyre több fénykép veszik el soha meg nem nyitott felhőtárhelyek mélyén...

szombat 13:56

Az óra ketyeg: veszélyben a Bitcoin a kvantumkorban?

⏱ Ez a jelenség jól illusztrálható azzal, hogy egy forradalmian új technológia, a kvantumszámítógép már belátható időn belül veszélybe sodorhatja a világ legismertebb kriptovalutájának, a bitcoinnak a jövőjét...

szombat 13:45

Az önellátó okostextilek forradalma: vége az okosórák korának?

A hordható kütyük piacán új korszak küszöbén állunk, ahol az egészségfigyelő eszközök már nemcsak a csuklónk díszei, hanem szó szerint a bőrünkhöz nőnek...

szombat 13:34

A Huawei Watch GT Runner 2 új etalon a futóórák között

🕑 A Huawei Watch GT Runner 2 kifejezetten a futás szerelmeseinek készült, és lenyűgöző pontossággal, villámgyors működéssel segít követni az eredményeket – egyetlen komoly hátulütője, hogy a megszokott, korlátozott Huawei-ökoszisztémára épül...

szombat 13:12

Az Apple-vezér visszavonul – az év techbombája!

💥 Ilyen eset például, amikor egy virtuális asszisztens tervez meg egy gamer PC-t, vagy amikor kiderül, hogy egy robot jobban fut félmaratont, mint bármelyik ember...

szombat 13:01

Az égbolt titkos koreográfiája: miért változnak a csillagképek?

Érdemes megvizsgálni, miért tűnnek fel és tűnnek el különböző csillagképek az év folyamán az éjszakai égbolton...

szombat 12:56

Az Android-csúcsmodellek ára történelmi mélyponton – itt az idő váltani?

💸 Érdemes megvizsgálni, mikor jár a legjobban az ember egy új Android-készülék vásárlásával...

szombat 12:45

Az USA zárol 125 milliárd forintnyi kriptót Irán miatt

Az amerikai pénzügyminisztérium legutóbbi lépése során 344 millió dollárnyi, vagyis csaknem 125 milliárd forintnyi Tether (USDT) került befagyasztásra, amellyel Irán pénzügyi hálózatait próbálják ellehetetleníteni...