2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 17:59

Az alternatív appboltok forradalma: Európa és Japán szabadul az Apple-től

🚀 Az Európai Unióban jelentős változást hozott a Digital Markets Act (DMA): mostantól nemcsak az Apple App Store-on keresztül lehet alkalmazásokat elérni, hanem különböző alternatív appboltok is megnyíltak az iPhone-felhasználók számára...

MA 17:39

Az égi show: hat bolygó táncol a horizonton

🌌 Február 28-án este ritka látványosságot ígér az égbolt: bolygóparádéban gyönyörködhet az, aki tiszta időben, akadálytalan kilátással nyugat felé figyeli a napnyugtát...

MA 17:21

Az eldobható kamerák visszatérnek: Camp Snap Pro vagy Flashback One35 V2?

A digitális gépek olcsóbb szegmense az utóbbi években reneszánszát éli, különösen a fiatalok között...

MA 17:01

A PreCheck mégsem szűnik meg: marad az amerikai gyorssáv

😊 A hétvégén gyorsan változott a helyzet a repülőterek gyorsított biztonsági ellenőrzését kínáló PreCheck szolgáltatás körül: miután az amerikai Belbiztonsági Minisztérium először azt közölte, hogy a részleges kormányzati leállás miatt szüneteltetik a szolgáltatást, vasárnap mégis az üzemelés folytatását jelentették be...

MA 16:40

A csillag, amely nyomtalanul tűnt el – robbanás nélküli fekete lyuk

⭐ Egy távoli csillag galaktikus szomszédunkban, az Androméda-galaxisban néhány éve egyszerűen eltűnt az égboltról – minden látványos robbanás nélkül...

MA 16:20

Az űrverseny valós ára: rakéták mérgezik a levegőt

Az utóbbi években a kereskedelmi űrrepülések robbanásszerű növekedése egyre komolyabb aggodalmakat vet fel: néhány ország és vállalat kvázi szemétlerakóként használja a Föld atmoszféráját...

MA 13:39

Az újabb téli vihar fél országot bénít: ezrével törlik a járatokat

Valóságos káosz uralkodott az amerikai reptereken, miután a légitársaságok több mint 6 ezer járatot töröltek a hétvégén és hétfőn, megelőzve a térségre lecsapó hatalmas hóvihart...

MA 13:20

Az új Xbox-főnök leszögezte: nem kérnek az AI-szemétből

Valóságos földindulás a Microsoftnál! Phil Spencer, a legendás Xbox-vezér és a szintén villámkezű Sarah Bond is dobbantott, a cég pedig tényleg leporolta a vezetőséget: már itt is van Asha Sharma, aki korábban a Meta és az Instacart háza táján is letette a névjegyét...

MA 11:59

A DNS-lottó mítosza: Tényleg becsapnak a genetikai tesztek?

Egy lényeges szempont, hogy a genetikai tesztelés forradalma az utóbbi években anélkül tört be a mindennapjainkba, hogy igazán értenénk, mire is vállalkozunk...

MA 11:39

Az ítélet lesújt a Teslára: 243 millió dollár a halálos Autopilot-balesetért

Komolyan mondom, a Tesla most tényleg ráfaragott: a bíróság nem nézte el a végzetes 2019-es balesetet, amelyben az Autopilot használata mellett meghalt egy ember, és egy másik súlyosan megsérült...

MA 11:20

A kelta vas átka: minden 54. embert fenyeget

A legújabb genetikai kutatások szerint Észak-Írországban és a Külső-Hebridákon élő embereknél a legmagasabb a hemochromatosis – magyarul vaslerakódásos betegség – kockázata...

MA 10:46

Az utolsó titok: miért merevedik meg a holttest?

🕵 Erre utal többek között az is, hogy a halál után az emberi test természetes folyamatokon megy keresztül: lehűl, elsápad, majd elmerevedik, mielőtt megkezdődne a bomlás...

MA 10:01

Az iPhone-ok titokban kémkedhetnek: így rejti el a Predator a felvételeket

Az Intellexa nevű megfigyelőcég által fejlesztett Predator kémprogram képes úgy rögzíteni az iPhone-ok kamerájának és mikrofonjának felvételeit, hogy közben teljesen eltünteti az iOS értesítőjeleket, így a felhasználó semmit sem vesz észre...

MA 09:55

A kanadai vérengzés és az OpenAI: meddig felel a gép?

Az egész világot megrázta, amikor egy 18 éves lány, Jesse Van Rootselaar a kanadai Tumbler Ridge városában nyolc embert ölt meg...

MA 09:47

Az MI-startupok új válsága: két sztármodell a szakadék szélén

🤯 A mesterséges intelligencia forradalom elképesztő startupdömpinget hozott, de mostanra körvonalazódni látszik, hogy két népszerű üzleti modell rendkívül törékeny lábakon áll...

MA 09:37

Az amerikaiak pánikolnak: tényleg nullára zuhanhat a Bitcoin?

💸 Az Egyesült Államokban idén februárban rekordot döntött a bitcoin lenullázódásával kapcsolatos Google-keresések száma...

MA 09:28

Az ősi Asgard-mikrobák már oxigénből éltek?

🌍 Már jóval azelőtt, hogy Földünk légkörében elterjedt volna az oxigén, egyes mikrobák valószínűleg már képesek voltak a gáz használatára...

MA 09:01

Az újabb hiba ismét késlelteti az Artemis II Hold-kilövését

🚀 Alig egy nappal azután, hogy a NASA március 6-át jelölte meg az Artemis II holdmisszió indításának céldátumaként, váratlan problémát észleltek a Space Launch System (SLS) rakéta felső fokozatában...

MA 08:47

A mesterséges intelligenciát utánzó termodinamikai számítógép forradalmasíthatja a képgenerálást

A tudósok új számítógépet alkottak, amely képes képeket előállítani pusztán véletlenszerű adatzajból...

MA 08:29

Az új terv: elkapnánk a közelgő üstököst – de gyorsan kell lépni

🚀 A 3I/ATLAS nevű, csillagközi eredetű üstökös feltűnése régóta izgatja a tudósokat, akik egyszerű átrepülés helyett közelről is szeretnék tanulmányozni ezt a különleges objektumot...

MA 08:20

A mesterséges intelligencia etikája ütközik a Pentagon katonai érdekeivel

🤓 A technológiai vállalatok fejlődése gyakran a hatékonyság és a tisztesség határait feszegeti...

MA 07:55

Az USA új arca: MI-hátszéllel tarol a Tech Corps

Több mint 240 000 amerikai önkénteskedett már a Peace Corps révén világszerte, de most új szintre tolták a jószolgálatot: elindul a Tech Corps, vagyis MI-szakértőkből verbuvált különítmény, akik a világ számos országába viszik az amerikai mesterségesintelligencia-tudást...

MA 07:46

Az amerikai MI-hadsereg: a Tech Corps világszerte bevetésre kész

Készüljetek, mert az USA tényleg szintet lépett az MI-versenyben: mostantól saját Tech Corps-tagjait küldi külföldre, akik elképesztő mesterségesintelligencia-tudásukat vetik be a világ minden táján...

MA 07:37

Az óriáspárna, ami szexivé teszi a téli olimpiai ugrásokat

🎅 A 2026-os milánói–cortinai téli olimpia már most sztárparádét ígér: látványos csavarok, pörgések és tripla trükkök, snowboardosok és freestyle síelők előadásában...

MA 07:28

Az élet nyomában: Miranda rejtett óceánja meglepetést tartogathat az Uránuszon

💧 A Naprendszeren belüli élet keresése újabb izgalmas fordulatot vett: most az Uránusz egyik holdja, Miranda került a középpontba...

MA 07:19

Az arcazonosítás sötét oldala: veszélyesebb, mint hinnéd

👀 Érdekes felvetés, hogy a telefonok arcfelismerő vagy ujjlenyomat-azonosító funkciója, amely egykor sci-finek tűnt, mára szinte mindennapossá vált – ugyanakkor komoly kockázatokat is rejt...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/22

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Self Timer (iPhone/iPad)Ez az alkalmazás új lehetőséget kínál a csoportképek és szelfik készítésére...

MA 07:11

Az űrrakéta újabb gondja: mégis visszagurul az Artemis II

🚀 Érdemes megérteni, miért kell a NASA-nak az Artemis II rakétát visszagurítania a szerelőcsarnokba...

MA 07:01

A mesterséges intelligencia, amely forradalmasítja a gyógyszerkutatást

Érdemes megérteni, hogy a londoni székhelyű Isomorphic Labs vadonatúj mesterségesintelligencia-rendszert mutatott be, amely alapjaiban formálhatja át a gyógyszerkutatást...