Kína mesterséges intelligenciája, amelyet 110 millió forintból fejlesztettek

Kína mesterséges intelligenciája, amelyet 110 millió forintból fejlesztettek
A DeepSeek R1 nevű nagyméretű nyelvi modell (LLM) óriási visszhangot keltett, amikor 2024 januárjában elérhetővé vált, és új irányt mutatott a mesterséges intelligencia fejlesztésében. Az egyik legfontosabb újdonsága, hogy fejlesztése során nem más, rivális MI modellek kimeneteire támaszkodott, hanem saját, önálló tanulási stratégiával épült fel. A Hangzhou-ban működő DeepSeek startup úttörőként vállalta, hogy elsőként publikálja szakmailag lektorált tanulmányban az R1 alapjait, valamint azt is, mennyi pénzből építették fel ezt a piacrengető eszközt. Érdemes kiemelni, hogy az MI-közösség platformján, a Hugging Face-en eddig már 10,9 millióan töltötték le az R1-et, és ezzel messze a legnépszerűbb nyílt súlyú modell lett.

Jóval olcsóbban hozták ki, mint az amerikai versenytársak

A DeepSeek R1 tréningköltsége mindössze 294 ezer dollár (kb. 110 millió forint) volt, miközben a hasonló modellek fejlesztése az USA-ban több milliárd forintot is felemészt. Bár a bázismodell fejlesztése 2,2 milliárd forintba került, a teljes összeg így is csak töredéke például az OpenAI vagy a Google költségvetésének. Az amerikai exportkorlátozások miatt ugyan az újabb Nvidia H800 chipeket már nem vásárolhatták meg Kínában, de a DeepSeek ezek nélkül is eredményesen tudta végigvinni a fejlesztési fázist.

A szakmai lektorálás új korszakot hozhat

Az R1 az első, széles körben ismert nyelvi modell, amely átment a tudományos szakmai lektorálás szigorú folyamatán. Ez különösen jelentős lépés, hiszen ilyen transzparencia mellett jobban értékelhetők az MI-kockázatok, és a fejlesztők felelőssége is világosabb. A szakmai kritikákra reagálva a DeepSeek csökkentette a modell emberszerűsítő kifejezéseinek használatát, pontosabban definiálta, milyen adatokat használtak fel, és kiemelten ügyelt a biztonsági szempontokra.

Forradalmi tanítási módszer és önálló gondolkodás

A DeepSeek legnagyobb újítása, hogy “tiszta megerősítéses tanulást” (pure reinforcement learning) alkalmaz. Itt a modell kísérletezve, jutalomértékek alapján, önállóan alakította ki a helyes következtetési sémákat az ember által kijelölt példák követése helyett. Saját megoldásait maga pontozta, külön algoritmus nélkül, a csoportos relatív politika-optimalizálás módszerével. Azóta sok versenytárs MI-fejlesztés is átvette ezt a hozzáállást.


Vita a tréningadatokról, de tiszta a lelkiismeret

Felmerült, hogy esetleg az OpenAI modelljeinek kimeneteit is felhasználták az R1 tanításához, de a DeepSeek kutatói ezt cáfolták a lektorálás során. Úgy nyilatkoztak, hogy csak annyira használtak MI-generált tartalmat, mint bármely más webes adatot – vagyis minimálisra szorították az ilyen típusú információk befolyását. Az MI-közösség visszajelzései alapján a DeepSeek módszere önmagában is elég hatékony a kimagasló teljesítményhez.

Jövőformáló hatás

Mindezt figyelembe véve a DeepSeek R1 a kutatók szerint nemcsak versenyképes, hanem új korszakot is teremt a matematika, programozás és más tudományos feladatok MI-alapú automatizálásában. Több laborban már dolgoznak azon, hogy a DeepSeek tanítási technikáit más nyelvi modellek képességeinek fejlesztésére is felhasználják – és könnyen lehet, hogy épp ez indít el egy új MI-forradalmat.

2025, adminboss, www.scientificamerican.com alapján

Legfrissebb posztok

szombat 20:48

A Firefoxban végre teljesen kikapcsolhatod az MI-t

A Mozilla új vezérigazgatója a héten bejelentette, hogy a Firefox modern MI-böngészővé válik, de a cég most azt is elárulta, hogy hamarosan egy teljes MI-kapcsolót vezetnek be...

szombat 20:34

A nagy csavar: az álmocskagomba nem is gomba

Sűrű, mohával borított erdők mélyén, Tajvan hegyeiben, Japán belsejében és Okinawa szubtrópusi lombjai alatt rejtőzik egy igencsak szokatlan élőlény...

szombat 20:18

Az MI forradalma a streamingben: végre tényleg nézhető lesz?

🎬 Érdemes megvizsgálni, hogy hamarosan teljesen új korszak köszönt be a videóstreaming világában...

szombat 20:02

Az öngyógyító kvantumszámítógép: mekkora az MI szénlábnyoma?

Kutatók áttörést értek el a kvantumszámítógépek fejlesztésében: elkészült az első, önmagát javítani képes rendszer...

szombat 19:18

A zöld miniszigetek felpezsdítik Dunedin belvárosát

Tényleg számítanak a legkisebb zöldterületek is: a Dunedin belvárosában megvalósított zöldítő projekt során utcai virágládákkal tették élőbbé és változatosabbá a környezetet...

szombat 19:01

A valódi ok, amiért hol nő, hol csökken a jövedelmed

📈 Érdemes megvizsgálni, mi mozgatja valójában a jövedelmek változását: hogyan lehet anyagilag előrelépni, és mi okozza a lecsúszást?..

szombat 18:50

Az új felfedezés mindent átírhat Titán rejtélyéről

Az eddigi elképzelések szerint a Szaturnusz legnagyobb holdja, a Titán, hatalmas óceánt rejt vastag, fagyott kérge alatt...

szombat 18:33

A kidobott műanyag a vegyipar új aranya?

📦 Érdekes felvetés, hogy vajon sikerülhet-e a műanyaghulladékot nemcsak lebontani, hanem értékes ipari anyagokká alakítani...

szombat 18:17

Az év leghosszabb éjszakáján érkezik az Ursidák fináléja

🌙 Az év utolsó, egyben legelhanyagoltabb meteorhullása, az Ursidák, most hétvégén éri el csúcspontját – ráadásul épp újholdkor és a téli napforduló idején...

szombat 18:03

A Fomalhaut körüli bolygóháború: óriások csapnak össze

A NASA Hubble-űrteleszkópja újabb bizonyítékot talált arra, hogy a közeli Fomalhaut csillag körül valójában nem egy új bolygó jelent meg, hanem két korai bolygókezdemény ütközése robbantotta fel az anyagfelhőt...

szombat 17:51

A legpontosabb kvantumszámítógép született – jön a szilíciumforradalom?

Ausztrál fizikusok áttörést értek el a kvantumszámítógépek világában: minden eddiginél pontosabb chipet fejlesztettek ki, amely új, szilíciumalapú architektúrára épül...

szombat 17:34

A sivatag titka: a núbiai gyerekek ősi tetoválásai

Több mint ezer éve Núbiában, a mai Szudán területén már egészen fiatal gyerekek arcát is tetoválások díszítették...

szombat 17:17

Az intersztelláris üstökös földközelben: vendég a kozmoszból

Éjszaka különleges esemény zajlott az égen: az intersztelláris eredetű 3I/ATLAS üstökös mintegy 270 millió kilométerre repült el a Föld mellett, ami csillagászati viszonylatban meglepően közelinek számít...

szombat 17:02

Az égi ütközések titkai: káosz a „Szauron szeme” körül

💫 Mindössze 25 fényévre innen, a Szauron szemének becézett Fomalhaut csillagrendszerben rendkívüli események tanúi lehetünk: csillagászok először figyeltek meg közvetlenül két bolygócsíra összeütközését, ráadásul mindössze húsz éven belül kétszer is...

szombat 16:04

Az új Meze 99 Classics második generáció: diófa, döngő basszus, némi fejfájás

🎧 Érdemes megvizsgálni, milyen élményt kínál a Meze Audio legújabb vezetékes fejhallgatója, a jól ismert 99 Classics utódja, amely lenyűgöző külsejével és zenei teljesítményével hódít...

szombat 15:50

Az év legizgalmasabb tudományos áttörései és űrbéli csodái

🚀 December közepén egymást érik a tudományos szenzációk: japán lézerfegyver-próba, rejtélyes üstökös búcsúja, pingvinevő pumák, és az MI megoldhatatlannak tartott matematikai problémákat old meg...

szombat 15:34

A mesterséges intelligencia ront a helyesíráson – veszélyben a gyerekek

Felmerül a kérdés, hogy mennyire támaszkodhatnak a gyerekek a digitális helyesírás-ellenőrző eszközökre az iskolai tanulmányaik során...

szombat 15:17

Az Airbus Európába költözteti kritikus adatait – a felhőbe

🖥 Az Airbus hamarosan pályázatot ír ki, hogy a legfontosabb vállalati alkalmazásait egy európai, digitálisan szuverén felhőbe költöztesse...

szombat 15:01

Az egykori Patagonia-vezér kiszáll a Rivian vezetéséből

🚗 Rose Marcario, a Patagonia korábbi vezérigazgatója január 1-jén lemond igazgatósági tagságáról a Rivian elektromos autógyártó cégnél, hogy más feladataira összpontosítson...