2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

szerda 20:36

A pangó kriptopiacon most a hozam viszi a prímet

💰 Az elmúlt fél évben a kriptovilág szokatlanul csendes. Az igazi tűzijátékok elmaradnak, különösen az alternatív coinok piacán, ahol a medvés trend az úr...

szerda 20:24

A Microsoft szerint a dolgozók fele már rajong az MI-ért?

Érdemes megvizsgálni, hogy miként változik a munka világa a mesterséges intelligencia elterjedésével...

szerda 20:12

A Hut 8 részvényei 30%-ot ugranak az óriási texasi MI‑adatközpont-bérlet hírére

📈 A Hut 8 részvényei közel 30%-kal ugrottak meg, amikor a cég bejelentette, hogy 15 évre szóló, 3 570 milliárd forintos (9,8 milliárd USD) bérleti szerződést kötött egy nagyszabású MI-adatközpont létesítésére Texasban, a Beacon Point nevű bérelt területén...

szerda 20:01

Az ExpressVPN turbót kap: gyorsabb vezérlés, jobb akadálymentesség Macen, Windowson és Linuxon

🚀 Az ExpressVPN legfrissebb, 14.1.0-s verziója jelentősen kényelmesebbé és gördülékenyebbé teszi a mindennapi használatot mind Macen, mind Windowson, mind Linuxon...

szerda 19:57

A Google már akár 1,5 millió dollárt fizet Android- és Chrome-sebezhetőségekért

A Google új szintre emelte a hibavadászatot: akár 1,5 millió dollárt (több mint 540 millió forintot) is hajlandó kifizetni annak, aki igazán komoly biztonsági rést fedez fel az Androidban vagy a Chrome böngészőben...

szerda 19:46

A kvantumakku, ami femtoszekundum alatt feltölt, éveket bírhat

⚡ Világszerte forradalomra készülhetünk az energiatárolás terén: ausztrál kutatók sikeresen létrehozták az első működő kvantumakkumulátort, amely lézersugárral egy billiárdod másodperc alatt teljesen feltölthető...

szerda 19:37

Az LG C6 nagy ugrás: a középkategóriás OLED-ek 2026-os etalonja

🙌 Az LG C6 OLED TV alapos tesztelés után egyértelműen bizonyította, hogy jelentős fejlesztést kínál elődje, a C5-höz képest...

szerda 19:25

Az MI-ügynökök saját kriptocéget alapítottak

Manfred, egy MI-alapú ügynök, történelmet írt: saját maga alapította meg első vállalkozását, önállóan kérte az amerikai adóhivataltól a cégalapításhoz szükséges regisztrációs kódot, amellyel legálisan működhet, alkalmazottakat vehet fel és engedélyeket szerezhet...

szerda 19:14

A könnyű, olcsó vezeték nélküli pálcasporszívók bajnoka: Hoover HF3 DynamicClean tesztje

💪 A Hoover HF3 DynamicClean vezeték nélküli porszívóval nem kell kompromisszumot kötnöd, ha limitált a költségvetésed, viszont ragaszkodsz a hatékony takarításhoz...

szerda 19:02

A SpaceX pénzügyei miatt riadót fújnak a SEC-nél

🚨 Úgy tűnik, hogy a SpaceX történetének legnagyobb tőzsdei bevezetése előtt komoly pénzügyi ellenőrzés célkeresztjébe került...

szerda 18:57

Az MI élesítése kikényszeríti a vállalati infrastruktúra újragondolását

⚡ Érdemes megvizsgálni, miként változik meg a nagyvállalatok infrastruktúrája az MI üzemi méretű bevezetésekor...

szerda 18:45

A Hugging Face megnyitotta a nyílt forrású Reachy Mini appáruházat 200+ appal

Képzeld el, hogy nem csak a telefonodra, hanem az íróasztalodon lévő kis robotodra is letölthetsz alkalmazásokat...

szerda 18:35

Az EVE Online stúdiója Fenris néven önállósodik, DeepMind-partner lesz

🚀 Az ikonikus EVE Online fejlesztője jelentős változásokat jelentett be: a korábban CCP Games néven ismert stúdió mostantól Fenris Creations néven működik tovább, miután függetlenedett a Pearl Abysstől, és hosszú távú, izgalmas együttműködést kötött a Google DeepMind csapatával...

szerda 16:34

A Multicoin nagy tétet tesz a Zcashre, visszatér az adatvédelem

🔒 A digitális pénzpiacokon újra fókuszba került az adatvédelem: a Multicoin Capital látványos pozíciót épített a Zcash (ZEC) tokenben, arra számítva, hogy a privát értéktárolás egyre fontosabb lesz, ahogy a pénzügyek tömegesen a blokkláncra költöznek...

szerda 16:23

Az elvetemült mod, ami küldetésjelölőkkel szentségteleníti meg a Morrowindet

⚠ Morrowind nemcsak legendás hangulata, hanem nehézsége miatt is kultjáték: annak különös világának rideg szabályait mindenkinek egyedül kell feltérképeznie...

szerda 16:12

A DeFi stressztesztje csendben ért véget: nem omlott össze semmi

💰 A kriptopiac mostanában főként a bitcoin árfolyam-emelkedésével foglalkozik, ám a decentralizált pénzügyek terén is lezajlott egy jelentős válság, amely végül csendben, látványos veszteségek nélkül ért véget...

szerda 16:02

A Kaspersky szerint a DAEMON Toolsba hátsó ajtót rejtettek célzott támadásokhoz

🔒 A DAEMON Tools, amelyet százezrek használnak virtuális meghajtók létrehozására, áldozatul esett egy kifinomult támadásnak: hackerek megfertőzték az eredeti weboldalról letölthető telepítőt...

szerda 15:57

A mobilodból úti fotó- és videógépet csináló kiegészítők

A ma kapható okostelefonok kamerái már annyira profik, hogy simán kiváltják a hagyományos fényképezőgépet, akár egy nyaralás alatt is...

szerda 15:46

A klímaváltozás az élelmiszer-ellátást a szakadék szélére sodorja

Az utóbbi évek szélsőséges időjárása nemcsak a szegényebb országokat, hanem a fejlett térségeket is egyre mélyebb élelmiszerválságba sodorja...

szerda 15:34

A Windows 11 fájlkezelője végre villámgyors lesz – ideje volt

A Windows 11 felhasználói régóta panaszkodnak arra, hogy a Fájlkezelő indítása lassú, főleg az első alkalommal, amikor megnyitjuk...

szerda 15:24

Az amerikai bankok már a blokkláncra építenek?

A pénzügyi szektor egyre határozottabban fordul a blokklánc-technológia felé, a nagy szereplők már nemcsak ismerkednek az új eszközökkel, hanem aktívan fejlesztik is azokat...

szerda 15:15

Az Amazon átállása miatt milliók Fire TV-je veszítheti el az HBO Maxot

Az HBO Max hamarosan több millió régebbi Amazon Fire TV eszközről eltűnik, mivel a platform már csak a Fire OS 6-ot vagy újabb operációs rendszert támogatja...

szerda 14:58

A mexikói klub üzenete: 110 ezres belépő az amerikaiaknak

A mexikóvárosi Japan nevű éjszakai klub hatalmas port kavart az interneten: az amerikaiaknak csaknem 110 ezer forintos (300 dolláros) belépőt kell fizetniük, miközben más külföldieknek mindössze 7 400 forintot (20 dollár), a mexikóiaknak és latin-amerikaiaknak pedig csupán 5 100 forintot (14 dollár) számítanak fel...

szerda 14:46

A Bitcoin 82 ezer fölé száguld, a ZEC és a Dash ralizik

🚀 Az elmúlt napokban a digitális pénzpiac új lendületet kapott, miután a Bitcoin átlépte a 82 ezer dolláros (kb...

szerda 14:35

Az év meglepetése: a RuneScape szénje lekörözte az Ethereumot

Idén egészen váratlanul a RuneScape nevű játék virtuális szénje körözte le az Ethereum kriptovalutát hozam tekintetében...

szerda 14:23

Az AMD játékbevétele 20% fölött eshet a memóriahiány miatt

📈 Az AMD az idei év első negyedévében rekordösszegű, 3830 milliárd forintnyi árbevételt könyvelhetett el...

szerda 14:02

A rejtélyes eset: egy nő hetekkel az új gyógyszer után kék-zöld lett

Egy 68 éves amerikai nő néhány héttel egy új gyógyszer szedésének kezdete után furcsa, kékes-fekete foltokat észlelt a karjain és lábain...

szerda 13:57

Az új MI-módszer nekifeszül a tudomány egyik legnehezebb matematikai problémájának

🧠 A tudósok évtizedek óta próbálják megfejteni, hogyan lehet a látható jelenségek mögött rejtőző, láthatatlan okokat feltárni...

szerda 13:34

Az új kriptóláz: az OKX perpetuális OpenAI- és SpaceX-futuresekkel támad

💸 A kriptotőzsdék új, vad hulláma indul, ahogy az OKX bejelentette: örökös határidős ügyleteket vezet be olyan magáncégekhez kapcsolódóan, mint az OpenAI, a SpaceX és az Anthropic...