2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 12:04

Az elavult rendszerektől a Cloudflare One-ig: Leáldozott az egylépéses átállások korának

A hálózati rendszermérnökök számára kevés dolog stresszesebb, mint amikor egy hétvége alatt kell átalakítani egy teljes infrastruktúrát, különösen, ha ez egy 30 ezres cégnél, több mint 1000 elavult alkalmazás új rendszerre való átkapcsolását jelenti...

MA 11:56

A káosznak vége: mobilon is rendezheted Spotify-listáidat

📷 Egy lényeges újdonság, hogy a Spotify mobilos alkalmazása hamarosan olyan funkcióval bővülhet, amelyre a felhasználók már 15 éve várnak: a lejátszási listák mappáinak kezelése közvetlenül telefonról is elérhető lesz...

MA 11:46

A műanyag fogságában élünk: a műanyag-detox döbbenetes igazsága

Egy átlagos nap szinte minden perce műanyaghoz köt: műanyag palackból isszuk a vizet, műanyag flakonból nyomjuk a tusfürdőt, műszálas ruhát viselünk, műanyag kiegészítőkkel körülvéve indulunk munkába...

MA 11:36

Az MI-háború tétje: veszélyben a felhasználók biztonsága?

A közösségi médiaóriások, köztük a TikTok és a Meta (a Facebook és az Instagram anyavállalata) az utóbbi években a felhasználók figyelméért vívott algoritmikus verseny során kérdéses döntéseket hoztak, amelyek lehetővé tették káros tartalmak nagyobb arányú megjelenését a felhasználói hírfolyamokban...

MA 11:24

Az új Galaxy S26 sem húzza ki a Samsungot a válságból

A Samsung történetének egyik legsikeresebb előrendelési hullámát könyvelheti el a Galaxy S26-sorozattal, de a vállalat mobilüzletága mégis vészhelyzeti üzemmódban működik...

MA 11:12

Az új Samsung Wide Fold: dupla élmény vagy dupla csalódás?

A Samsung idén nagyot villant: ha minden igaz, érkezik a Wide Fold – a pletykák szerint ez lesz a válasz a feltörekvő iPhone Foldra...

MA 11:02

Az új Galaxy S26 Ultra kijelzője váratlanul gyenge lett

😥 A Samsung Galaxy S26 Ultra legfrissebb bejelentése nagy port kavart a vadonatúj, adatvédelmi célú kijelzőinnovációval, amely a betekintési szögeket szabályozza az extra adatvédelemért...

MA 10:57

Az új rákdetektor másodpercek alatt leleplezi a daganatokat

Egy forradalmian új, „világító” antitest fejlesztésével a kutatók képessé válhatnak arra, hogy a daganatos betegségek kimutatása egyszerűbbé, gyorsabbá és pontosabbá váljon...

MA 10:51

Itt a nagy áttörés: napfényből üzemanyagot termelő anyagok

🔥 A napenergiából származó üzemanyag vagy vegyi anyag előállítása régóta foglalkoztatja a tudományos világot...

MA 10:43

Az ausztrál szenátus rákapcsol: jön a kemény kriptószabályozás

💰 Végre történik valami nagyon is húsbavágó Ausztráliában: a szenátusi bizottság rábólintott egy olyan törvényjavaslatra, amely a kriptoplatformokat és letétkezelő cégeket simán beemeli az ország pénzügyi szolgáltatási rendszerébe...

MA 10:36

Az XRP áttörte az ellenállást: indul az újabb rali?

Az XRP árfolyama rövid idő alatt 3%-kal nőtt, túllépte az 545 Ft-os (1,47 USD) szintet, miután áttörte a hosszú ideje fennálló ellenállást...

MA 10:29

Az Apple csendes forradalma: így vitt mindent a többiek orra elől

Úgy tűnik, hogy az elmúlt években kialakult MI-őrületben minden nagyvállalat óriási összegeket költött adatközpontokra, egyvalaki azonban a partvonalról figyelte ezt az őrült költekezést: az Apple...

MA 10:22

Az Egyesült Királyság nagy dobása: ezermilliárdok az atomfúziós áttörésre

Az Egyesült Királyság közel 1000 milliárd forinttal támogatja a következő öt évben a fúziós energiát, egy merész terv keretében, amelynek célja, hogy az ország globális éllovassá váljon ezen az áttörést ígérő területen...

MA 10:10

Az MI-pánik már öl: tényleg veszélyben vagyunk?

⚠ A kanadai Tumbler Ridge-i iskolai lövöldözés előtt egy 18 éves diáklány, Jesse Van Rootselaar beszélgetéseket folytatott a ChatGPT-vel magányosságáról és erősödő erőszakfantáziáiról...

MA 09:51

Az MI tényleg felszabadítja a kreativitásunkat?

Fontos kérdés, hogy az MI valóban helyettesíteni akarja-e az embert, vagy éppen ellenkezőleg: új módon segíthet minket...

MA 09:36

Az Anthropic dupla örömhíre: bővül a Claude‑limit a nem éjjeli baglyoknak

Komolyan mondom, néha úgy érzem, imádnak minket egyes cégek, aztán mégis ott motoszkál hátul, hogy jó, jó, persze, csak közben valami apróbetűs rész mindig előugrik...

MA 09:30

Sosem látott szintre ugrott a techóriások szén-dioxid-kvótavásárlása az MI-versenyben

🌍 Az MI-fejlesztések hatására a nagy technológiai vállalatok drasztikusan növelik szén-dioxid-kvóta-vásárlásaikat, hogy ellensúlyozzák a növekvő energiafogyasztásukból eredő kibocsátásaikat...

MA 09:22

A mesterséges intelligencia pár másodperc alatt megfejti a fizika legmélyebb rejtélyét

🧠 A Los Alamos-i Nemzeti Laboratórium és az Új-Mexikói Egyetem kutatói forradalmi áttörést értek el a statisztikai fizika területén...

MA 08:57

Az emésztőrendszer új titkos fegyvere: bélfehérje irtja a kórokozókat

🤰 Egy eddig kevéssé ismert bélfehérje, az intelectin-2, kettős védelmi vonalat alakít ki a szervezetben: egyrészt erősíti a bélfalat borító nyákréteget, másrészt csapdába ejti és elpusztítja a kórokozó baktériumokat...

MA 08:43

A Galaxy Buds 4 Pro: luxus, amit csak Galaxy-tulaj élvez igazán

🔈 A Samsung frissített Galaxy Buds 4 Pro fülese minden eddiginél jobban szól: duplán erősített, nagyobb teljesítményű mélynyomók dübörögnek benne, menő, penge formát kapott, még tisztább hívásminőséget és fejlettebb zajszűrést ígér...

MA 08:36

Az MI tarol – Elbúcsúzhatok az álommunkámtól?

Van abban valami szédítő, hogy végre megtalálod a munkát, amit imádsz – például újságíró és író vagy, elmerülsz a sztorikban, és nap mint nap okosnak és hasznosnak érzed magad...

MA 08:22

A Macskaszem-köd utolsó tánca: lélegzetelállító űrfotó a haldokló csillagról

🔮 A világegyetem sötétjében ragyog a híres Macskaszem-köd (Cat’s Eye Nebula, NGC 6543), amely izzó, kék, narancs és vörös gázgyűrűivel, valamint bonyolult alakzatával a csillag halálának káprázatos jelenetét tárja elénk...

MA 08:09

A csodaszer, ami altat, de veszélyes lehet: melatoninpánik a gyerekeknél

Felmerül a kérdés, hogy miért nyúlnak egyre többen a melatonin után, ha a gyerekük nem alszik jól...

MA 08:02

A Meta újabb óriásleépítése: mindent visz az MI?

A Meta komoly leépítéseket tervez, amelyek akár a dolgozók ötödét is érinthetik...

MA 07:50

A ChatGPT‑hirdetések egyelőre csak Amerikában futnak

📢 Noha sok felhasználó észrevette, hogy a ChatGPT frissített adatvédelmi tájékoztatójában már szó esik a hirdetésekről, egyelőre nem tervezik ezeket a reklámokat bevezetni az Egyesült Államokon kívül...

MA 07:43

Az Oracle MI-je több mint 200 ezer órát adott vissza az orvosoknak

Az Oracle részvényei szárnyalni kezdtek, miután a vállalat várakozáson felüli harmadik negyedéves eredményeket közölt, és meglepően optimista előrejelzést adott a bevételekre...

MA 07:30

Az új MI‑GPU-ház odaver az asztali gépeknek

🚀 Fontos kérdés, meddig lehet még fokozni a laptopok számítási teljesítményét, különösen, amikor az MI-alkalmazások már szinte mindenhol jelen vannak...

MA 07:22

Az MI csapdái: így kerüld el a látványos kudarcokat

Az utóbbi időben egyre több hír szól arról, hogy a cégek hiába költenek többet és többet MI-projektekre, a kudarc aránya zavaróan magas...

MA 07:15

Az Oscar-partik titkos sztárja: három új MI-trükk, amitől padlót fogsz.

🍾 A filmiparban minden héten felrobban az internet egy-egy új generatív MI-mutatvánnyal, és már az is csoda, ha egy filmes egyáltalán tartani tudja a tempót...