Kína mesterséges intelligenciája, amelyet 110 millió forintból fejlesztettek

Kína mesterséges intelligenciája, amelyet 110 millió forintból fejlesztettek
A DeepSeek R1 nevű nagyméretű nyelvi modell (LLM) óriási visszhangot keltett, amikor 2024 januárjában elérhetővé vált, és új irányt mutatott a mesterséges intelligencia fejlesztésében. Az egyik legfontosabb újdonsága, hogy fejlesztése során nem más, rivális MI modellek kimeneteire támaszkodott, hanem saját, önálló tanulási stratégiával épült fel. A Hangzhou-ban működő DeepSeek startup úttörőként vállalta, hogy elsőként publikálja szakmailag lektorált tanulmányban az R1 alapjait, valamint azt is, mennyi pénzből építették fel ezt a piacrengető eszközt. Érdemes kiemelni, hogy az MI-közösség platformján, a Hugging Face-en eddig már 10,9 millióan töltötték le az R1-et, és ezzel messze a legnépszerűbb nyílt súlyú modell lett.

Jóval olcsóbban hozták ki, mint az amerikai versenytársak

A DeepSeek R1 tréningköltsége mindössze 294 ezer dollár (kb. 110 millió forint) volt, miközben a hasonló modellek fejlesztése az USA-ban több milliárd forintot is felemészt. Bár a bázismodell fejlesztése 2,2 milliárd forintba került, a teljes összeg így is csak töredéke például az OpenAI vagy a Google költségvetésének. Az amerikai exportkorlátozások miatt ugyan az újabb Nvidia H800 chipeket már nem vásárolhatták meg Kínában, de a DeepSeek ezek nélkül is eredményesen tudta végigvinni a fejlesztési fázist.

A szakmai lektorálás új korszakot hozhat

Az R1 az első, széles körben ismert nyelvi modell, amely átment a tudományos szakmai lektorálás szigorú folyamatán. Ez különösen jelentős lépés, hiszen ilyen transzparencia mellett jobban értékelhetők az MI-kockázatok, és a fejlesztők felelőssége is világosabb. A szakmai kritikákra reagálva a DeepSeek csökkentette a modell emberszerűsítő kifejezéseinek használatát, pontosabban definiálta, milyen adatokat használtak fel, és kiemelten ügyelt a biztonsági szempontokra.

Forradalmi tanítási módszer és önálló gondolkodás

A DeepSeek legnagyobb újítása, hogy “tiszta megerősítéses tanulást” (pure reinforcement learning) alkalmaz. Itt a modell kísérletezve, jutalomértékek alapján, önállóan alakította ki a helyes következtetési sémákat az ember által kijelölt példák követése helyett. Saját megoldásait maga pontozta, külön algoritmus nélkül, a csoportos relatív politika-optimalizálás módszerével. Azóta sok versenytárs MI-fejlesztés is átvette ezt a hozzáállást.


Vita a tréningadatokról, de tiszta a lelkiismeret

Felmerült, hogy esetleg az OpenAI modelljeinek kimeneteit is felhasználták az R1 tanításához, de a DeepSeek kutatói ezt cáfolták a lektorálás során. Úgy nyilatkoztak, hogy csak annyira használtak MI-generált tartalmat, mint bármely más webes adatot – vagyis minimálisra szorították az ilyen típusú információk befolyását. Az MI-közösség visszajelzései alapján a DeepSeek módszere önmagában is elég hatékony a kimagasló teljesítményhez.

Jövőformáló hatás

Mindezt figyelembe véve a DeepSeek R1 a kutatók szerint nemcsak versenyképes, hanem új korszakot is teremt a matematika, programozás és más tudományos feladatok MI-alapú automatizálásában. Több laborban már dolgoznak azon, hogy a DeepSeek tanítási technikáit más nyelvi modellek képességeinek fejlesztésére is felhasználják – és könnyen lehet, hogy épp ez indít el egy új MI-forradalmat.

2025, adminboss, www.scientificamerican.com alapján


Legfrissebb posztok

hétfő 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...

hétfő 20:55

Az Xpeng lenyomja a nagyokat olcsó villanyautóival

A kínai Xpeng történelmi növekedést mutat az elektromos autók piacán: egymás után második hónapban szállított le több mint 40 000 autót, ezzel a szegmens robbanásszerű tömegpiaci stratégiájának egyik legnagyobb nyertesévé vált...



hétfő 20:46

Az élet mulandóságát hirdette egy pompeji mozaik

Egyedülálló mozaikot fedeztek fel Pompejiben, amely még a Vezúv kitörése előtt készült, és emlékezteti a szemlélőt: mindannyian halandók vagyunk...

hétfő 20:37

Az első engedélyezett BMW: itt a kéz nélküli autópályás vezetés

A BMW első autógyártóként kapta meg a friss ENSZ 171-es szabályozás szerinti jóváhagyást, amellyel Motorway Assistant nevű rendszerét már több országban is bevezethetik...



hétfő 20:28

Valóban nekünk szólnak az MI-böngészők?

A böngészők világa forradalmi változásokon megy keresztül, az MI-integráció egyre nagyobb teret hódít...



hétfő 20:19

Az Apple legolcsóbb okosórája most fillérekbe kerül

Az Apple Watch SE 3 most először lett igazán olcsó: az Amazonon 199,99 dollárért, vagyis nagyjából 73 000 forintért lehet megvásárolni, ami körülbelül 18 000 forintos árcsökkenést jelent...



hétfő 20:01

Az OpenAI már évi 4 700 milliárd forint körül jár?

Sam Altman, az OpenAI vezérigazgatója szerint a cég jóval 13 milliárd dollár, vagyis nagyjából 4 700 milliárd forint éves bevétellel büszkélkedhet – és nála most már tényleg elég a folytonos faggatózásból, hogy miből fizetik ki az elképesztő költségeket...

hétfő 19:46

Az élet szikráját az ifjú Nap dühöngése adhatta

A fiatal Naphoz hasonló csillagok óriási energiájú kitörései döntő szerepet játszhattak abban, hogy a Földön megjelenjen az élet...



hétfő 19:37

Az idegesítő Windows-hiba végre eltűnt: leáll, ha leállítod

Sok felhasználó dühöngött már azon, hogy a „Frissítés és leállítás” opció valójában nem állította le a gépet, hanem újraindította...



hétfő 19:28

Az új Redmagic gamer mobil tényleg folyadékhűtéssel jön

🔥 A Redmagic 11 Pro szakít a hagyományokkal: ez az első olyan okostelefon (a kínai modelleken kívül), amely valódi folyadékhűtéssel érkezik...

hétfő 19:19

Az Nvidia és a Microsoft beindítja az MI-őrületet az Emirátusokban

🚀 Az Egyesült Államok jóváhagyta, hogy a Microsoft exportálhassa az Nvidia legújabb, csúcsteljesítményű GB300-as GPU-it az Egyesült Arab Emírségekbe...



hétfő 19:11

2025, Nov 3 Google Trend

Keresés1 Volumen2 Növekmény %3 manófalva 2000 900 otp 5000 100 otp internetbank 2000 300 jim curtis 2000 1000 david harbour 2000 1000 hideg 1000 1000 torre dei conti 500 1000 sassuolo–genoa 200 1000 családi pótlék utalása 1000 1000 tisza világ 500 800 miller dávid 10000 1000 milan–roma 2000 1000 időjárás 20000 75 időkép 5000 75...



hétfő 19:10

Az új Windows-frissítés miatt nem lehet bezárni a Feladatkezelőt

Az októberi, KB5067036 számú Windows 11-frissítés váratlan hibát okozott: a Feladatkezelő bezárása után is a háttérben marad, ami jelentősen ronthatja a gép teljesítményét...



hétfő 19:03

Véget értek az Internet Archive küzdelmei, de nagy árat fizettek érte

A San Franciscó-i Internet Archive ebben a hónapban ünnepelte, hogy a Wayback Machine elérte az ezermilliárdodik lementett weboldalt...



hétfő 18:47

Eltűnt a Facebook varázsa, nosztalgikus reklámokkal próbál visszacsábítani

A karácsonyi időszakban minden eddiginél többen kelnek útra, hogy hazalátogassanak, családjukkal és régi barátaikkal találkozzanak...



hétfő 18:37

Az egész világ pénzügyeit bekebelezi a blokklánc?

A Standard Chartered vezérigazgatója, Bill Winters szerint hamarosan szinte minden nemzetközi pénzügyi tranzakció digitális blokkláncfőkönyvre kerül át, és a pénzek is teljesen digitálissá válnak...



hétfő 18:28

Az orka-csapatok már a cápabölcsődéket is vadásszák

🐴 Először sikerült felvételt készíteni arról, ahogy egy orkacsapat (gyilkos bálnák) fiatal nagy fehér cápákat támad meg a Kaliforniai-öbölben...



hétfő 18:20

Az év ajándékslágerei 2025-ben, mindenki ezekért rajong

2025-ben ismét kirobbanóan népszerű lett a Google által összeállított Holiday 100 toplista, amely a legkeresettebb ajándékokat vonultatja fel...



hétfő 18:10

Már a fiatal nagy fehér cápákat is megtámadják az orák

🐟 Az elmúlt években különleges orkapopulációra figyeltek fel a Kaliforniai-öbölben, amelynek tagjai mesteri módon vadásznak fiatal nagy fehér cápákra: a zsákmányt hasra fordítják, hogy könnyedén hozzájussanak a rendkívül tápanyagdús májhoz...