2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

APP
MA 07:13

APPok, Amik Ingyenesek MA, 1/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Funny Kids Poems (iPhone/iPad)A Funny Kids Poems egy játékos, interaktív könyv, amelyet legfeljebb 6 éves gyerekek számára terveztek iPhone és iPad készülékekre...

MA 07:09

Az Aircela gépe: Benzint gyárt a levegőből – mostantól igen!

A New York-i Aircela startup kifejlesztett egy gépet, amely szinte csak áram és a levegő segítségével képes benzint előállítani – első hallásra mintha a Börtönök és Sárkányok (Dungeons & Dragons) egyik alkimistájától származna az ötlet, de valójában teljesen tudományos eljárásról van szó...

MA 07:01

Az 1Password leleplezi a gyanús adathalász oldalakat

🔒 Az 1Password jelszókezelő mostantól beépített figyelmeztetésekkel óv a gyanús adathalász oldalaktól...

MA 06:57

A következő két évben két látványos, teljes napfogyatkozás jön

🌑 Két év szünet után ismét két egymást követő évben tűnik el teljesen a Nap a Hold árnyékában: 2026...

MA 06:49

Az Apple februárban lerántja a leplet a Gemini-Siriről

Jelentősen átalakított Sirit mutathat be az Apple február második felében, és ezúttal nem is akárhogyan: a Google Gemini MI-je költözik az asszisztens motorházteteje alá...

MA 06:43

Az MI aranybányája: a tudós, aki forradalmasította a tűzoltást

🔥 Sunny Sethi nem éppen olyan embernek tűnik, aki felforgatta volna a tűzoltók világát...

MA 06:33

A nyugtató képernyőzés valójában csak növeli a stresszt?

A mai világban egyre többen érzik magukat kimerültnek, mégis a legtöbben a képernyők előtt próbálnak kikapcsolódni...

MA 06:26

A valaha talált legősibb sziklarajz, gigantikus víztározó és brutális napvihar

🌍 A tudományos világ ezen a héten elképesztő felfedezésekkel és meglepetésekkel szolgált, amelyek alapjaiban rengették meg eddigi ismereteinket...

MA 06:17

Veszélyben a géped az új Windows 11-frissítéstől?

⚠ Érdemes tudni, hogy a Microsoft gyanúja szerint bizonyos PC-k egyáltalán nem indulnak el a Windows 11 2026...

MA 06:05

Történelmi események a mai napon (Január 26.)

Rövid visszatekintés a mai napra a történelemben: óriási természeti katasztrófák, birodalmak sorsfordító csatái és államalapítások formálták a világot...

MA 06:01

A NexPhone: androidos mobilodból egy mozdulattal PC lesz

Az eddig NexDock néven ismert kiegészítőkkel már évekkel ezelőtt laptop-munkaállomássá alakíthattad a mobilodat, most azonban a Nex Computer saját okostelefonnal állt elő...

vasárnap 20:56

A gigászi Schrödinger-macska: minden eddiginél nagyobb kvantumállapot

🐈 A kvantumfizika egészen elképesztő kísérlettel bővült: Bécsben kutatóknak sikerült többezeres nátriumatom-klasztert úgy „megosztaniuk”, hogy ez a csoport egyszerre több helyen is tartózkodott – vagyis hatalmas szuperpozícióba került...

vasárnap 20:37

A NAV lecsap a kriptóra – így jelentsd be!

Amikor megjelent a kriptovaluta, sokaknak tetszett az ötlet, hogy nincs mögötte kormány vagy jegybank...

vasárnap 20:19

A legújabb Windows 11-frissítés kék halált hoz?

💻 A Microsoft vizsgálja, miért omlanak össze egyes Windows 11-es gépek a januári biztonsági frissítés telepítése után...

vasárnap 20:01

A mindennapi apróságokkal éveket nyerhetsz az életedhez

Valóban szükség van radikális diétára, napi több óra edzésre és végeláthatatlan zöldségzabálásra, hogy tovább éljünk?..

vasárnap 19:55

Az amerikai Délnyugatot meghódító ősi vadburgonya

Több mint tízezer évvel ezelőtt az amerikai Délnyugat lakói egy kis vadburgonyát, a Four Corners-burgonyát (Four Corners potato, Solanum jamesii) vitték magukkal hosszú vándorlásaik során...

vasárnap 19:38

Az AmpereOne-t is megizzasztó Dynatron W23 hűtő nagytesztje

Míg az Ampere Altra Max processzorhoz számos hűtőopció létezett, az új AmpereOne-hoz már jóval kevesebb az elérhető megoldás...

vasárnap 19:19

Az orosz hackerek új vírusától rettegett a lengyel energiahálózat

⚠ Lengyelország elektromos hálózatát tavaly év végén eddig ismeretlen törlővírus támadta meg, amely valószínűleg orosz állami hackerekhez köthető...

vasárnap 18:57

Az ausztrál emlősök végzete: kóbor macskák és rókák?

🐱 Ausztrália emlősfaunája a világon egyedülálló: a hosszú elszigeteltség olyan fajokat eredményezett, mint a kacsacsőrű emlős, a koala vagy a vombat...

vasárnap 18:37

Az Outlook megint lefagy – a Microsoft villámgyorsan lépett

💥 A Microsoft villámgyors, rendkívüli frissítéseket adott ki szombaton Windows 10, Windows 11 és Windows Server rendszerekhez, miután sokaknál egyszerűen nem indult el a klasszikus Outlook, ha a PST-fájlokat felhőben tárolták, például a OneDrive-on vagy a Dropboxon...

vasárnap 18:20

Az Edison-izzó és a grafén véletlen születésének titkos története

A grafén a jelenleg ismert legvékonyabb anyag: egyrétegű szénatomokból épül fel, hatszögletű rácsban...

vasárnap 18:02

Az a telefon, amelyért Amerika könyörögne: Fairphone 6

Az amerikai okostelefon-piacot szinte teljes egészében az Apple és a Samsung uralja...

vasárnap 17:55

Kitört az e-bike-háború New Jerseyben

New Jersey-ben mostantól minden elektromos kerékpár-tulajdonos a legszigorúbb szabályozással szembesül. Legyen szó akár egy 20 km/h-s, pedálrásegítéses kerékpárról vagy egy motorkerékpár-teljesítményű e-bike-ról, mindenkire ugyanazok a szigorú előírások vonatkoznak: kötelező a regisztráció, a jogosítvány és a biztosítás...

vasárnap 17:37

Az adatvédelem vége? A Microsoft kiadta a titkosítási kulcsokat

Az FBI tavaly bírósági végzéssel kérte a Microsofttól, hogy adja át három laptop titkosítási kulcsait egy olyan csalási ügy vizsgálata miatt, amely a Guam szigetén folyósított COVID–19-munkanélküli-támogatásokat érintette...

vasárnap 17:20

Az MI-óriások davosi összecsapása: egymásnak estek a csúcson

Davos idén alaposan átalakult: a Világgazdasági Fórum korábbi, komoly hangvételű tanácskozását techcégek színesítették meg az MI-forradalom jegyében...

vasárnap 17:02

A mesterséges intelligencia terjed az iskolákban – megéri az árát?

Az MI térhódítása az oktatásban komoly aggodalmakat kelt világszerte. Egy friss, 50 országot és több mint 500 tanárt, diákot, szülőt, oktatási vezetőt és szakértőt bevonó, egy évig tartó globális kutatás eredményei szerint az MI alkalmazásának kockázatai jelenleg felülmúlják az esetleges előnyöket...

vasárnap 16:55

Az aszály soha nem látott ütemben feszíti szét Kelet-Afrikát

Kelet-Afrika éghajlata az elmúlt 5 000 évben jelentősen kiszáradt, és ez a változás arra utal, hogy a kontinens a vártnál gyorsabban szakad szét...

vasárnap 16:37

Vége az ingyenes WhatsAppnak? Jön a fizetős reklámmentesség

💳 Sokan egyetértenek abban, hogy a hirdetések idegesítőek, és a WhatsApp sem kerülte el ezt a sorsot...

vasárnap 16:02

Kudarcot vallott az orosz kibertámadás a lengyel áramhálózat ellen

⚡ Lengyelország villamosenergia-hálózata elleni kibertámadást hiúsítottak meg 2025. december végén. A támadás mögött az orosz állam által támogatott, hírhedt Sandworm nevű hackercsoport állt, amely egy új, pusztító törlővírust, a DynoWipert próbálta bevetni...