2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 18:19

Az Adobe leállítja az Animate-et, felháborodtak az animátorok és fejlesztők

Az Adobe váratlanul bejelentette, hogy megszünteti az Adobe Animate programot, és erről e-mailben értesítette a felhasználókat...

MA 18:02

A francia rendőrség razziázott az X irodájában a Grok deepfake-botrány miatt

A francia hatóságok kedden razziát tartottak az X párizsi irodájában, miután büntetőeljárás indult a platform Grok nevű MI-eszköze miatt, amelyet széles körben használtak szexuálisan explicit képek generálására...

MA 17:56

Az alumínium visszatér: csúszós Google-forradalom a laptopokon?

Hosszú évek várakozása után végre eljuthatunk oda, hogy a Google egyesíti az Androidot és a ChromeOS-t egyetlen operációs rendszerben...

MA 17:38

A Waymo robban: önvezető taxik 20 új városban

🚗 A Google anyacégéhez, az Alphabethez tartozó Waymo komolyan veszi a Tesla egyre erősebb kihívását, és hatalmas bővülésre készül...

MA 17:19

Az Artemis II főpróbája szivárgás miatt hiúsult meg

A NASA leállította az Artemis II rakéta hidrogénnel való feltöltését, miután feltételezett szivárgást észleltek az üzemanyagrendszerben...

MA 17:04

Az új hűtő tényleg megéri – ennyit spórolsz a villanyszámlán

Az otthoni nagy háztartási gépek közül a hűtőszekrény az, amely folyamatosan fogyasztja az áramot – ezért nem árt időnként elgondolkodni a cseréjén...

MA 16:56

Az új Windows 11-frissítés felforgatja a mindennapokat

💻 A februári Windows 11-frissítés már a küszöbön áll, és nemcsak apró változásokkal, hanem néhány igazán izgalmas újítással érkezik...

MA 16:38

Az olcsó fém lehet a klímaválság kulcsa?

⚡ A Yale Egyetem és a Missouri Egyetem kutatói jelentős áttörést értek el a tiszta energiaforrások kutatásában: sikerült egy olcsó, könnyen hozzáférhető fém, a mangán segítségével hatékonyan átalakítani a szén-dioxidot formiáttá...

MA 16:19

Az MI-láz pörgeti a tőzsdéket, a Palantir az élen

A Palantir rendkívül erős negyedéves eredményei valódi felfutást indítottak el a globális részvénypiacokon...

MA 16:01

A Nothing Phone 4a-széria küszöbön: hamarosan debütál

📱 A Nothing Phone 4a és a Nothing Phone 4a Pro várhatóan már március elején, pontosabban március 5-én mutatkoznak be, így aki új készülékre vágyik, annak már alig egy hónapot kell csak várnia...

MA 15:55

Az új BTS-korszak berobban: koncert, film és világtúra a Netflixen

🎶 A K-pop ikonikus zenekara, a BTS idén márciusban nagyszabású visszatérést tart...

MA 15:37

Az okos zárak kora leáldozott Kínában

🔒 Kína betiltja a Tesla-féle rejtett, elektronikus ajtónyitókat, miután ezek számos halálos balesethez vezettek...

MA 15:21

Az Artemis II megint csúszik: a hidrogén utat tör magának

🚀 A NASA ismét elhalasztja az Artemis II holdmisszió indítását, mert a hétfői próbán a rakéta és a floridai Kennedy Űrközpont indítóállványa között komoly hidrogénszivárgást észleltek...

MA 15:02

A Crunchyroll árat emel: drágább lesz az anime

Az anime-rajongóknak mélyebben kell a zsebükbe nyúlniuk, ugyanis emelkedtek a Crunchyroll havidíjai...

MA 14:20

A Pfizer új, havi injekciója forradalmasíthatja a fogyást

A Pfizer legújabb humán kísérlete biztató eredményeket mutat egy új, havonta adható elhízás elleni injekcióval kapcsolatban...

MA 14:02

Az új Switch csúcsra ért, történelmet ír a Nintendo

A Switch végre letaszította a DS-t a trónról, így minden idők legkelendőbb Nintendo konzolja lett: 2025...

MA 13:38

A SpaceX bekebelezte az xAI-t – MI forradalom az űrben

🚀 Elon Musk újabb meghökkentő lépése alapjaiban formálja át a technológiai világot: a SpaceX váratlanul felvásárolta a három éve alapított xAI-t, így egyesült a rakétatechnológia, az MI és az űrinternet világa...

MA 13:19

Az orosz hekkerek ismét célba vették a Microsoft Office-t

🕵 A napokban orosz hackerek, az APT28 (más néven Fancy Bear vagy Sofacy), kihasználták a Microsoft Office egy frissen javított sérülékenységét (CVE-2026-21509) célzott támadásokhoz Ukrajnában és más európai szervezetek ellen...

MA 13:02

A szíved otthoni ellenőrzésének két pofonegyszerű módja

Érdekes felvetés, hogy a szívbetegségek, amelyek ma Magyarországon is vezető haláloknak számítanak, sok esetben megelőzhetők lennének egy kis odafigyeléssel...

MA 12:55

Az MI még nem gyújtotta be a kriptó rakétáit

Az MI és a kriptopiac összefonódása rengeteg izgalmat vált ki, de egyelőre hiányzik az a világos és közérthető alkalmazás, amely valódi áttörést hozna...

MA 12:37

Az X francia irodáira is rajtaütött a rendőrség

A francia hatóságok kibervédelmi egységei, az Europol támogatásával, razziát tartottak Elon Musk közösségi platformjának, az X-nek a párizsi irodáiban...

MA 12:02

Az óceán közepe sem menedék: műanyag üldözi a halakat

🐠 A Csendes-óceán legtávolabbi, érintetlennek hitt vizei sem tudják már megóvni a halakat a műanyaghulladék terjedésétől...

MA 11:56

Az Artemis II holdküldetés megint késik – a NASA-t sokkolta az ok

Ezek után érthető, hogy a NASA ismét elhalasztja az Artemis II küldetést, amely négy űrhajóst indítana a Hold köré...

MA 11:38

Az MMS „csodaszere”: az ára a súlyos sejtkárosodás

Az úgynevezett Miracle Mineral Solution (MMS) évek óta kering mint univerzális gyógymód rákra, autizmusra és COVID-19-re...

MA 10:57

Az új Google Home-frissítés végre ér valamit?

💡 A Google Home új frissítésének köszönhetően a kamerák legfrissebb felvételei most már sokkal megbízhatóbban lejátszhatók, így a bosszantó “A videó nem érhető el” hibák ritkábban fordulnak majd elő...

MA 10:49

A SpaceX Elon Muskkal az űrbe viszi a mesterséges intelligenciát

Elon Musk egyesíti a SpaceX-et és az xAI-t (amely az X-et is birtokolja), hogy létrehozza a Földön (és azon túl) a legambiciózusabb, egységes innovációs gépezetet...

MA 10:42

A Waymo 5800 milliárd forintot húzott be az önvezető taxi‑világhódításra

A Waymo friss tőkebevonása 5800 milliárd forintot hozott a cég kasszájába, hogy önvezető taxiparkját az USA számos új városába, sőt a világ több pontjára is eljuttassa...

MA 10:17

A Moltbook MI-kultusza: új őrület vagy mesterséges botrány?

🕵 Az elmúlt napokban a Moltbook nevű közösségi oldal hirtelen mindenki figyelmét felkeltette a techvilágban...

MA 10:01

Az új, csirkeméretű dinoszaurusz átírja a dinoszauruszok történetét

Egy apró növényevő dinoszaurusz, a Foskeia pelendonum különös anatómiája alaposan meglepte a kutatókat...