Kako je vrhunski kitajski model umetne inteligence premagal ameriške sankcije (MIT Technology Review – 24. januar 2025)

Prispevek na spletnem portalu revije MIT Technology Review o vzponu družbe DeepSeek je z novim modelom razmišljanja, ki je enako zmogljiv kot ChatGPT o1, uspelo omejitve spremeniti v inovacije.

Podrobnosti prispevka lahko povzamemo, kot sledi:

Predstavitev programa DeepSeek R1:

  • DeepSeek R1 je nov odprtokodni model sklepanja, ki ga je razvilo kitajsko zagonsko podjetje.
  • Po poročanju naj bi deloval primerljivo ali bolje kot ChatGPT o1 podjetja OpenAI in imel nižje stroške.

Vpliv nadzora izvoza v ZDA:

  • Ameriški nadzor izvoza tehnologije ni zmanjšal kitajskih zmogljivosti umetne inteligence, kot je bilo pričakovano.
  • Te sankcije so podjetja, kot je DeepSeek, spodbudile k inovacijam in večji učinkovitosti.

Optimizacija procesa usposabljanja:

  • Družba DeepSeek je prilagodila svoj proces usposabljanja, da bi zmanjšala zahteve za grafične procesorje z omejeno zmogljivostjo.
  • Ta optimizacija je ključna za premagovanje omejitev strojne opreme, s katerimi se soočajo zaradi trgovinskih omejitev.

Pionirske zmožnosti utemeljevanja:

  • R1 je bil priznan zaradi svojih sposobnosti pri zapletenih nalogah sklepanja, kot sta matematika in kodiranje.
  • Pri reševanju problemov uporablja pristop „verige misli“, podoben metodologiji ChatGPT o1.

Dostopnost različic R1:

  • Družba DeepSeek je izdala manjše različice sistema R1, ki se lahko izvajajo na lokalnih prenosnih računalnikih.
  • Ena različica je v nekaterih primerjalnih testih celo boljša od OpenAI-jevega o1-mini.

Strategija upravljanja virov:

  • DeepSeek si je pred nedavnimi sankcijami zagotovil veliko zalogo čipov Nvidia A100.
  • S to strategijo je podjetje v konkurenčnem okolju umetne inteligence na Kitajskem v ugodnem položaju.

Izzivi za kitajska podjetja s področja umetne inteligence:

  • Kitajska zagonska podjetja na področju umetne inteligence se soočajo z veliko konkurenco velikih tehnoloških podjetij in izzivi financiranja.
  • Številna majhna podjetja se v primerjavi z večjimi igralci spopadajo z omejitvami glede učinkovitosti in virov.

Poudarek na odprtokodnem sodelovanju:

  • Kitajska podjetja vse bolj sprejemajo odprtokodne strategije za izboljšanje sodelovanja na področju raziskav.
  • Ta kulturni premik odraža močno usklajenost s svetovnimi odprtokodnimi gibanji in razvojnimi cilji.

URL: https://www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/