Prispevek na spletnem portalu revije MIT Technology Review o vzponu družbe DeepSeek je z novim modelom razmišljanja, ki je enako zmogljiv kot ChatGPT o1, uspelo omejitve spremeniti v inovacije.
Podrobnosti prispevka lahko povzamemo, kot sledi:
Predstavitev programa DeepSeek R1:
- DeepSeek R1 je nov odprtokodni model sklepanja, ki ga je razvilo kitajsko zagonsko podjetje.
- Po poročanju naj bi deloval primerljivo ali bolje kot ChatGPT o1 podjetja OpenAI in imel nižje stroške.
Vpliv nadzora izvoza v ZDA:
- Ameriški nadzor izvoza tehnologije ni zmanjšal kitajskih zmogljivosti umetne inteligence, kot je bilo pričakovano.
- Te sankcije so podjetja, kot je DeepSeek, spodbudile k inovacijam in večji učinkovitosti.
Optimizacija procesa usposabljanja:
- Družba DeepSeek je prilagodila svoj proces usposabljanja, da bi zmanjšala zahteve za grafične procesorje z omejeno zmogljivostjo.
- Ta optimizacija je ključna za premagovanje omejitev strojne opreme, s katerimi se soočajo zaradi trgovinskih omejitev.
Pionirske zmožnosti utemeljevanja:
- R1 je bil priznan zaradi svojih sposobnosti pri zapletenih nalogah sklepanja, kot sta matematika in kodiranje.
- Pri reševanju problemov uporablja pristop „verige misli“, podoben metodologiji ChatGPT o1.
Dostopnost različic R1:
- Družba DeepSeek je izdala manjše različice sistema R1, ki se lahko izvajajo na lokalnih prenosnih računalnikih.
- Ena različica je v nekaterih primerjalnih testih celo boljša od OpenAI-jevega o1-mini.
Strategija upravljanja virov:
- DeepSeek si je pred nedavnimi sankcijami zagotovil veliko zalogo čipov Nvidia A100.
- S to strategijo je podjetje v konkurenčnem okolju umetne inteligence na Kitajskem v ugodnem položaju.
Izzivi za kitajska podjetja s področja umetne inteligence:
- Kitajska zagonska podjetja na področju umetne inteligence se soočajo z veliko konkurenco velikih tehnoloških podjetij in izzivi financiranja.
- Številna majhna podjetja se v primerjavi z večjimi igralci spopadajo z omejitvami glede učinkovitosti in virov.
Poudarek na odprtokodnem sodelovanju:
- Kitajska podjetja vse bolj sprejemajo odprtokodne strategije za izboljšanje sodelovanja na področju raziskav.
- Ta kulturni premik odraža močno usklajenost s svetovnimi odprtokodnimi gibanji in razvojnimi cilji.
URL: https://www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/