2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 10:49

A SpaceX Elon Muskkal az űrbe viszi a mesterséges intelligenciát

Elon Musk egyesíti a SpaceX-et és az xAI-t (amely az X-et is birtokolja), hogy létrehozza a Földön (és azon túl) a legambiciózusabb, egységes innovációs gépezetet...

MA 10:42

A Waymo 5800 milliárd forintot húzott be az önvezető taxi‑világhódításra

A Waymo friss tőkebevonása 5800 milliárd forintot hozott a cég kasszájába, hogy önvezető taxiparkját az USA számos új városába, sőt a világ több pontjára is eljuttassa...

MA 10:17

A Moltbook MI-kultusza: új őrület vagy mesterséges botrány?

🕵 Az elmúlt napokban a Moltbook nevű közösségi oldal hirtelen mindenki figyelmét felkeltette a techvilágban...

MA 10:01

Az új, csirkeméretű dinoszaurusz átírja a dinoszauruszok történetét

Egy apró növényevő dinoszaurusz, a Foskeia pelendonum különös anatómiája alaposan meglepte a kutatókat...

MA 09:49

A mesterséges intelligencia űrutazása: a SpaceX felvásárolta az xAI-t

Elon Musk újra megkeverte a lapokat: a SpaceX bekebelezte saját MI-cégét, az xAI-t, így egy fedél alá kerülnek a rakéták, a műholdas internet, a mesterséges intelligencia és a világelső, szólásszabadságot hirdető közösségi platform...

MA 09:41

Megint drágít a Crunchyroll: az animések pénztárcája bánja

💸 A Crunchyroll ismét árat emel minden előfizetési csomagján – ráadásul a változás minden szintet érint...

MA 09:34

A Galaxy Z TriFold elfogyott – mit jelent ez a Galaxy S26-nak?

Érdekes kérdés, mivel készül a Samsung az okostelefon-piacon: néhány nap alatt teljesen elfogyott a Galaxy Z TriFold, amely minden előjel nélkül, csekély hírveréssel került forgalomba, és meglepően magas, 1 070 000 forint körüli áron talált gazdára...

MA 09:25

A bitcoin visszavág: új kriptohullám a hétvégi zuhanás után

Az elmúlt napokban a bitcoin árfolyama hatalmas hullámvasútra ült, miután hétvégén 74 000 dollár (kb...

MA 09:10

Az űridőjárás tombol: brutális napkitörések közelegnek

🌌 Az elmúlt 24 órában a Nap 4366-os aktív foltja elképesztő, 27 napkitörést produkált, ráadásul ezek között volt az utóbbi évek legerősebb kitörése is...

MA 09:01

Az új szabály véget vet Kínában a rejtett kilincsek korszakának

Kína hamarosan betiltja az elektromos autókon az elrejtett ajtókilincseket, miután több tragikus baleset nyomán világszerte megkérdőjelezték ezt a megoldást, amelyet a Tesla tett elterjedtté...

MA 08:49

Az évszázad legnagyobb napkitörése – tanúi lehettünk

Vasárnap a Nap hatalmas kitörésekkel lepte meg a Földet: az elmúlt harminc év egyik legerősebb napkitörése beragyogta a világűr sötétjét...

MA 08:41

Az MI memóriáját forradalmasítja a SoftBank–Intel szövetség

💻 A SoftBank leányvállalata, a Saimemory és az Intel közös fejlesztésbe kezd, hogy megalkossa a következő generációs MI-hez és nagyteljesítményű számítástechnikához készült memóriatechnológiát...

MA 08:33

A kínai hatóságok betiltják az eltűnő autókilincseket

A kínai hatóságok betiltották a rejtett, karosszériába süllyesztett autókilincseket, amelyek az utóbbi években egyre népszerűbbé váltak az autógyártók körében, főként aerodinamikai és dizájn okokból...

MA 08:17

Végre kikapcsolhatod az MI-t a Firefoxban

A Firefox új frissítése végre lehetőséget ad a felhasználóknak arra, amire már régóta várnak: teljesen kikapcsolhatóvá vált minden MI-funkció...

MA 08:01

A Google Telefon új trükkje, amire senki sem várt

📱 Az okostelefonok szoftverei folyamatosan frissülnek, ezért néha nehéz követni, mikor és miért változik meg egy-egy alkalmazás kinézete vagy működése...

MA 07:57

Az ólom sötét öröksége: tisztábbak vagyunk, de még nincs vége

🔫 Az emberi haj többet mesél rólunk, mint hinnénk: egy évszázadon át gyűjtött hajtincsek alapján utahi kutatók most lenyűgöző eredményre jutottak...

MA 07:50

A Notepad++ frissítéseivel kémkedett Kína?

🕵 A népszerű Notepad++ szöveg- és kódszerkesztő felhasználói hónapokon át veszélyben voltak, miután a szoftver frissítéseit terjesztő szervereket tavaly feltörték...

MA 07:42

A Waymo 5,7 billió forintos dobása: jönnek a robottaxik világszerte

🚗 A Waymo, az Alphabet önvezető autós cége újabb óriási befektetést kapott: 5,7 billió forint (16 milliárd USD) tőkét vont be, amellyel globálisan, több mint egy tucat új városban – köztük Tokióban és Londonban – terjeszti ki sofőr nélküli taxiszolgáltatását még az idén...

MA 07:34

A mesterséges intelligencia közösségi hálója kiteregette a felhasználói adatokat

A Moltbook nevű közösségi oldal azzal büszkélkedik, hogy MI-ügynököknek kínál közösségi teret – azonban most kiderült, hogy több ezer emberi felhasználó adatait tette nyilvánossá egy hiányos biztonsági védelem miatt...

MA 07:25

Az újabb Windows-frissítési baki még több gépet dönt romba

Januári Windows-frissítés után egyre több felhasználó szembesül azzal a bosszantó hibával, hogy számítógépe nem képes leállni vagy hibernálni, hanem újraindul...

MA 07:17

Jön az iPhone Fold brutál akkuval és új gombokkal

Az Apple első hajlítható iPhone-járól újabb részletek szivárogtak ki: a készülék a valaha volt legnagyobb, 5500 mAh-s akkumulátort kaphatja meg...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/3

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:09

Az Apple nagy dobása: érkezik a kagylóhéj‑iPhone?

Úgy tűnik, hamarosan véget ér a klasszikus, lapos okostelefonok időszaka. Egyre erősebbek a pletykák arról, hogy az Apple 2026 végén dobhatja piacra első összecsukható telefonját, ráadásul dolgozik egy kagylóhéj-formájú, vagyis flip kivitelű modellen is...

MA 07:01

Az új GlassWorm-támadás már a Maceket is fenyegeti

Egy veszélyes, GlassWorm nevű kártevő új módszert talált arra, hogy macOS-rendszereken fejlesztők jelszavait, kriptotárca-adatait és bizalmas információit lopja el...

MA 06:57

Az új Starlink Wi‑Fi a felhők fölé emeli az otthoni netet

Elképesztő, hogy ma már nemcsak a földön, de a magasban is élvezhetjük a stabil, gyors internetet: a Starlink műholdas Wi-Fi már a United Airlines járatain is úgy működik, mintha csak otthon lennél...

MA 06:49

Az OpenClaw támad: jelszólopó kártevők célozzák az MI-asszisztenst

🔪 Több mint 230 rosszindulatú kiegészítő jelent meg kevesebb mint egy hét alatt az OpenClaw (korábbi nevén Moltbot és ClawdBot) személyes MI asszisztens hivatalos regisztrációs oldalán és a GitHubon...

MA 06:41

Vége a rejtett autókilincsek korszakának Kínában

🚗 Kína betiltotta a rejtett ajtókilincseket az elektromos autókon, és ezzel elsőként lépett fel a látványos, de ellentmondásos Tesla-dizájn ellen...

MA 06:34

Az óceán mélyén új világ tárul fel: ismeretlen fajok százai

🐚 Ahogy a kritikus fémek iránti igény világszerte emelkedik, egyre több ország vizsgálja a tengerfenék kitermelésének lehetőségét...

MA 06:25

Az MI fűti az árakat: közeleg a memóriaválság

A memóriapiacon rég nem látott válság van kibontakozóban: 2026 első negyedévében minden eddiginél gyorsabban nőnek a DRAM és a NAND flash memóriák árai...