2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 11:13

Az MI sötét oldala: káosz, perek, milliárdos veszteségek fenyegetik a cégeket

⚠ A vállalatok mind a mai napig keresik a helyes módszereket, hogyan integrálhatják az MI-t a saját működésükbe, és ez nem is baj – hiszen idő kell ahhoz, hogy átlássák az MI által generált kód és tartalom valós problémáit...

MA 11:01

A Pokémon Go ártatlan játéka indította be a futárrobot-forradalmat

A Pokémon Go-játékosok fényképezési szokásai, amelyek először apróságnak tűntek, mára robotforradalmat indítottak el...

MA 10:57

A hatalmas föld alatti vezeték Québecből árammal látja el New Yorkot

Egy több mint 545 km hosszú, 6 milliárd dolláros (kb. 2 200 milliárd forint) föld alatti vezetékrendszer, a Champlain Hudson Power Express az elkövetkező hónapokban már képes lesz ellátni New York City-t a Montreal térségéből származó megújuló vízenergiával...

MA 10:37

A namíbiai Nagy Fehér Hely szellemtavait feltáró űrfotó lenyűgözi a világot

Namíbia északnyugati részén, a végtelennek tűnő Etosha Pan szélén meghökkentő, szivárványszínű tavak jelentek meg egy 2011-es katasztrofális árvíz után...

MA 10:23

Az OpenClaw tényleg a biztonsági rendszerek rémálma?

Például elképzelhető, hogy egyetlen utasítást rejt el egy támadó egy továbbított e-mailben...

MA 10:02

A világegyetem ősi fénye titokzatosabban csavarodik, mint gondoltuk

💫 A világegyetem legrégebbi fényében felfedezett finom csavarodás új lendületet adhat azoknak a kutatásoknak, amelyek az univerzum legnagyobb kérdéseire keresik a választ...

MA 09:57

Az Nvidia chipje az egybillió dolláros álomhatár kapujában

💰 Jensen Huang egy pillanatig sem fogta vissza magát a színpadon, amikor a vadonatúj Blackwell- és Vera Rubin-csipekről áradozott – és na most kapaszkodj, mert olyan számokat dobott be, hogy az ember csak pislog...

MA 09:43

Az Nvidia gyeplőre fogná az MI-ügynököket

🐒 Tipikus eset, amikor a technológiai játékosság komoly megoldásokat rejt: az Nvidia legújabb fejlesztése, a NemoClaw már nemcsak a jövőkutatók kedvenc témája, hanem valós segítséget jelenthet a vállalati MI-ügynökök biztonságának kezelésében...

MA 09:36

A Waymo betör és tarol: önvezetők felforgatják a fuvarpiacot

🚗 Hadd ordítsam bele a levegőbe, hogy itt az új főnök: a Waymo berobbant az utazásmegosztó buliba, és mindenkit lesöpör — Uber, Lyft, Tesla, szoronghattok!..

MA 09:29

Az Nvidia kétfrontos offenzívája: biztonságosabb MI, kevesebb para?

Az Nvidia legújabb GTC keynote-ján bedobta a köztudatba a NemoClaw-t, egy vadonatúj biztonsági réteget, ami extra védelmet ad az OpenClaw MI-ügynökeihez...

MA 09:22

Az MI-kriptók szárnyalnak: jön az ügynökalapú hullám

Az MI-alapú kriptovaluták értéke kiugró növekedést mutatott, miután az Nvidia vezérigazgatója, Jensen Huang vázolta a vállalat következő lépéseit az MI-infrastruktúra terén a GTC fejlesztői konferenciáján...

MA 08:57

A természet megőrült: hóvihar, árvíz és hőhullám egyszerre

Március szeszélyes arculatát idén is bizonyítja: miközben a Hawaii-szigeteket özönvízszerű esőzések sújtják, az Egyesült Államok középnyugati területein a hó vastagon borít mindent, máshol soha nem látott meleg tombol, az ország keleti részein pedig viharoktól és tornádóktól rettegnek...

MA 08:45

Az Nvidia Vera Rubin platformja hét chippel új MI-korszakot nyit

Egy lényeges szempont, hogy az Nvidia ismét felforgatta a MI-iparágat: bemutatták a Vera Rubin nevű hétchipes platformot, amely minden eddiginél nagyobb teljesítménnyel és energiahatékonysággal kecsegtet, és amely mögött olyan óriások sorakoztak fel, mint az OpenAI, az Anthropic, a Meta vagy a Mistral AI...

MA 08:38

Az Nvidia asztali szuperszámítógépe: trilliós paraméterű MI mindenkinek, felhő nélkül

💻 Nvidia új DGX Station gépe egy teljesen új korszakot nyit az asztali számítástechnikában...

MA 07:57

Az Nvidia felturbózza a játékokat: itt a DLSS 5, az AI‑csodaszűrő

Elképesztő, mit tud a DLSS 5: a legújabb Nvidia AI-alapú felskálázási technológia nem egyszerűen élesebb képet ad, hanem teljesen új szintre emeli a látványt — ráadásul úgy, hogy közben minden részlet valósághűbbnek hat...

MA 07:50

Az EU-t elárasztja a robotaxi-láz: Bolt és NVIDIA összefog

🚗 Nem hiszem el, de a Bolt összefogott az NVIDIA-val, hogy Európában is berobbanhasson a robotaxi-biznisz...

MA 07:43

Az xAI-botrány: tizenévesek perelik a Grokot szexuális visszaélésért

🔴 Három tennessee-i tinédzser pert indított Kaliforniában az xAI ellen, mert szerintük a Grok nevű MI a fotóikat felhasználva gyermekbántalmazásnak minősülő képeket készített...

MA 07:36

Az új Sony-csoda: extrém képminőség PS5 Pro-n

Képzeld el, hogy a PS5 Pro mostantól még durvább képminőséget hoz ki a kedvenc játékaidból – és nem kell hozzá 4 millió forintos tévé sem!..

MA 07:23

A Samsung új Privacy Displayje tényleg csökkenti a kijelző fényerejét?

💡 A Samsung Galaxy S26 Ultra egyik legizgalmasabb újdonsága a Privacy Display nevű funkció, amely bizonyos nézési szögekből korlátozza a kijelző láthatóságát...

MA 07:15

Az Nvidia friss dobásai: MI-ügynök, lélegzetelállító grafika és Vera CPU

Az Nvidia ismét új szintre emeli a jövő technológiáját. Egyetlen eseményen mutatták be azt az MI-alapú fejlesztést, amely forradalmasíthatja a játékélményt és a professzionális adatközpontokat, ráadásul bemutatták a Vera CPU-t, ami minden eddiginél nagyobb teljesítményt ígér a mesterséges intelligencia korszakában...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 3/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Juggly Ball (iPhone/iPad)Ez a fizika alapú ügyességi játék próbára teszi a labdazsonglőr tudásodat...

MA 07:08

Az új Boox Go berobban: ultravékony, világítós E Ink tablet Android 15-tel

A legújabb Boox Go 10.3 Lumi tablet jelentősen bővíti az E Ink eszközök lehetőségeit...

MA 07:01

Az Exchange Online újra letérdelt: se e-mail, se naptár

A Microsoft Exchange Online szolgáltatása komoly leállást szenvedett el, ami miatt rengeteg felhasználó nem tudott hozzáférni sem a postafiókjához, sem a naptárjához...

MA 06:58

Az élet nagy dobása: amikor a növények partra szálltak

Földünk mai képe egészen más lenne, ha néhány apró, kitartó élőlény évmilliárdokkal ezelőtt nem vállalta volna az ismeretlen felfedezését...

MA 06:50

Az Nvidia áttörése alapjaiban formálja át az MI-alapú adattárolást

Felmerül a kérdés: miként orvosolható az a probléma, amikor egy MI-ügynök a feladat közben elveszíti a kontextust, mert a hagyományos adattárolás már nem tudja tartani a tempót a gyorsabb következtetésekkel?..

MA 06:43

Az xAI-t beperelték a Grok miatt: újabb botrány Musknál

💥 Három Tennessee állambeli tinédzser beperelte Elon Musk xAI-ját, akik szerint a vállalat mesterséges intelligenciája, a Grok, szexuális jellegű képeket és videókat készített róluk, amikor még kiskorúak voltak...

MA 06:37

Az Nvidia új csodafegyvere: lélegzetelálló grafika, bizarr arcok

Az Nvidia bemutatta legújabb fejlesztését, a DLSS 5-öt, amely a vállalat szerint korszakváltó áttörést jelent a számítógépes grafika világában...

MA 06:30

Az óriáscég 80 ezer gépét törölték: kitört a káosz, kézi rendelés!

Külön említést érdemel, hogy a múlt héten súlyos kibertámadás érte a Stryker orvostechnológiai vállalatot, amelynek során közel 80 ezer eszköz adatait törölték az éjszaka folyamán – mindezt anélkül, hogy bármilyen rosszindulatú programot bevetettek volna...

MA 06:22

Az áttörés: új injekció tünteti el a rákot

💉 Egy új fejlesztésű immunterápiás eljárás, amelyet közvetlenül a daganatba fecskendeznek, lenyűgöző eredményeket adott egy klinikai vizsgálatban...