Kínai AI cég rengeti meg a nyugati tech-óriások trónját

Kínai AI cég rengeti meg a nyugati tech-óriások trónját
A DeepSeek, egy kínai mesterséges intelligencia laboratórium hirtelen a figyelem középpontjába került, miután AI modelljei, melyeket hatékony számítási módszerekkel fejlesztettek, megkérdőjelezték az USA vezető szerepét az AI versenyben és a chipek iránti kereslet fenntarthatóságát.

A kereskedői gyökerek

A DeepSeek mögött a High-Flyer Capital Management áll, egy kínai kvantitatív hedge fund, amely AI-t használ kereskedési döntéseinek meghozatalához. A cég 2015-ös alapítása óta jelentős fejlődésen ment keresztül, míg 2023-ban önálló AI kutatólaboratóriummá nőtte ki magát.

Technikai kiválóság fiatal elmékkel

A kezdetektől fogva saját adatközpontokat épített modelljeik tréningezéséhez. A kínai korlátozások miatt kénytelenek voltak a gyengébb Nvidia H800 chipeket használni az amerikai cégek számára elérhető H100-as helyett. A fiatal, doktori fokozattal rendelkező kutatókból álló csapat azonban így is kiemelkedő eredményeket ért el.

Áttörő modellek

A 2023 novemberében debütáló első modellek után a DeepSeek-V2 család már komoly figyelmet kapott az iparágban. A szöveg- és képelemző rendszer kiváló teljesítményt nyújtott a benchmarkokon, ráadásul jóval költséghatékonyabban működött, mint versenytársai. A 2024 decemberében megjelent V3 és a januári R1 “reasoning” modell pedig további áttörést hozott.


Üzleti stratégia és jövőkép

# Egy felforgató megközelítés

Ha a DeepSeek rendelkezik üzleti modellel, nem teljesen világos, hogy pontosan mi is az. A vállalat a piaci érték alatt árazta termékeit és szolgáltatásait – míg másokat ingyen kínál.

Ahogy a DeepSeek előadja, a hatékonyságban elért áttörések tették lehetővé számára, hogy fenntartsa rendkívüli költségversenyképességét. Néhány szakértő azonban vitatja a vállalat által közölt számadatokat.

Bárhogy is legyen, a fejlesztők kedvelik a DeepSeek modelljeit, amelyek nem nyílt forráskódúak a kifejezés szokásos értelmében, de olyan megengedő licencek alatt érhetők el, amelyek lehetővé teszik a kereskedelmi felhasználást. Clem Delangue, a Hugging Face vezérigazgatója szerint – amely a DeepSeek modelljeit is tároló platformok egyike – a Hugging Face fejlesztői több mint 500 “származékos” modellt hoztak létre az R1 alapján, amelyek összesen 2,5 millió letöltést értek el.

A DeepSeek nagyobb és jobban megalapozott versenytársakkal szembeni sikerét “az AI felforgatásaként” és “túlhájpoltként” is jellemezték. A vállalat sikere legalább részben felelős volt azért, hogy az Nvidia részvényárfolyama hétfőn 18%-kal csökkent, és kiváltotta Sam Altman, az OpenAI vezérigazgatójának nyilvános reakcióját.

Még a Microsoft is partner

A Microsoft bejelentette, hogy a DeepSeek elérhető az Azure AI Foundry szolgáltatásán, a Microsoft platformján, amely vállalatok számára egyesíti az AI szolgáltatásokat egyetlen égisze alatt. Amikor az első negyedéves eredményeket bemutató konferenciahívás során a DeepSeek Meta AI kiadásaira gyakorolt hatásáról kérdezték, Mark Zuckerberg vezérigazgató azt mondta, hogy az AI infrastruktúrára fordított kiadások továbbra is “stratégiai előnyt” jelentenek a Meta számára.

Ugyanakkor egyes vállalatok betiltják a DeepSeek használatát, és ezt teszik egész országok és kormányok is, beleértve Dél-Koreát. New York állam szintén megtiltotta a DeepSeek használatát kormányzati eszközökön.

Ami a DeepSeek jövőjét illeti, az nem egyértelmű. A továbbfejlesztett modellek adottak. De úgy tűnik, az amerikai kormány egyre inkább tart attól, amit káros külföldi befolyásnak tekint.

  • Mit gondolsz, érdemes kockázatot vállalni a new-tech cégekért, mint a DeepSeek, még akkor is, ha üzleti modelljük nem teljesen átlátható?
  • Ha te lennél a DeepSeek vezetője, hogyan védenéd meg a cégedet az amerikai korlátozásokkal szemben?
  • Vajon helyes döntés volt a fiatal kutatókra támaszkodni, annak ellenére, hogy a használt chipek nem a legerősebbek a piacon?




Legfrissebb posztok