DeepSeek: ЯИ пейзажын революцияләүче

AIPU WATON GROUP

Кереш сүз

Зур модельләр, базар өлеше өчен көндәш булган болыт тәэмин итүчеләре, һәм чип җитештерүче чип җитештерүчеләре арасында дәвам итүче борчылулар - DeepSeek эффекты дәвам итә.

Яз фестивале тәмамлангач, DeepSeek тирәсендәге дулкынлану көчле булып кала. Соңгы бәйрәм технология өлкәсендә зур көндәшлек хисе күрсәтте, күпләр бу "мәче" турында фикер алыштылар һәм анализладылар. Кремний үзәнлеге моңарчы күрелмәгән кризис хисе кичерә: ачык чыганакны яклаучылар кабат үз фикерләрен әйтәләр, һәм хәтта OpenAI ябык чыганак стратегиясе иң яхшы сайлау булганын яңадан бәяли. Түбән исәпләү чыгымнарының яңа парадигмасы Nvidia кебек чип гигантлары арасында чылбырлы реакция тудырды, АКШ фонд базары тарихында бер көнлек базар бәясен югалтуга китерде, дәүләт органнары DeepSeek кулланган чипларның туры килүен тикшерәләр. DeepSeek чит илләрдә катнаш рецензияләр эчендә, ул гадәттән тыш үсеш кичерә. R1 моделе эшләтеп җибәрелгәннән соң, бәйләнешле кушымта трафикның артуын күрде, бу куллану секторының үсеше гомуми ЯИ экосистемасын алга этәрәчәген күрсәтә. Уңай ягы - DeepSeek куллану мөмкинлекләрен киңәйтәчәк, ChatGPTка таяну киләчәктә кыйммәт булмас. Бу смена OpenAIның соңгы эшчәнлегендә чагылыш тапты, шул исәптән DeepSeek R1 җавапларына бушлай кулланучыларга o3-mini дип аталган модель тәкъдим итү, шулай ук ​​o3-mini фикерләр чылбырын популярлаштырган яңартулар. Күпчелек чит ил кулланучылары бу үсеш өчен DeepSeekка рәхмәт белдерделәр, гәрчә бу фикер чылбыры кыскача мәгълүмат булып хезмәт итә.

Оптимистик яктан, DeepSeek эчке уенчыларны берләштерә. Укыту чыгымнарын киметүгә юнәлтелгәндә, төрле агымдагы чип җитештерүчеләре, арада болыт провайдерлары һәм күпсанлы стартаплар экосистемага актив кушылалар, DeepSeek моделен куллану өчен чыгым нәтиҗәлелеген күтәрәләр. DeepSeek кәгазьләре буенча, V3 моделен тулысынча әзерләү бары тик 2,788 миллион H800 GPU сәгате таләп итә, һәм укыту процессы бик тотрыклы. MoE (Экспертлар катнашмасы) архитектурасы 405 миллиард параметрлы Llama 3 белән чагыштырганда, тренингка кадәрге чыгымнарны ун факторга киметү өчен бик мөһим. Хәзерге вакытта V3 - MoE-та шундый югары сирәклекне күрсәтүче беренче танылган модель. Өстәвенә, MLA (Күп катламлы игътибар) синергистик, аеруча фикерләү аспектларында эшли. "ЭЭМ сирәк булса, исәпләү көчен тулысынча куллану өчен фикер йөртү вакытында кирәк булган партия күләме зуррак, KVCache зурлыгы чикләүче фактор булып тора; MLA KVCache күләмен сизелерлек киметә", дип билгеләде Чуанцин Технологиясе тикшерүчесе AI Technology Review. Гомумән, DeepSeek уңышлары бер генә түгел, төрле технологияләр кушылуында. Промышленность инсайдерлары DeepSeek командасының инженерлык мөмкинлекләрен мактыйлар, параллель тренировкаларда һәм операторларны оптимизацияләүдә алдынгы булуларын күрсәтәләр, һәр детальне чистартып, төп нәтиҗәләргә ирешәләр. DeepSeek-ның ачык чыганак алымы эре модельләрнең гомуми үсешен тагын да көчәйтә, һәм охшаш модельләр рәсемнәргә, видеоларга һәм башкаларга таралса, бу тармактагы ихтыяҗны сизелерлек стимуллаштырыр дип көтелә.

Өченче як фикерләү хезмәтләре өчен мөмкинлекләр

Мәгълүматлар шуны күрсәтә: DeepSeek 21 көн эчендә көн саен 22,15 миллион актив кулланучы (DAU) туплады, ChatGPT кулланучылар базасының 41,6% ка иреште һәм Doubao'ның көндәлек актив кулланучыларыннан 16,95 миллионнан артып китте, шулай итеп 157 ил / төбәктә Apple App Store кибетендә беренче урында. Ләкин, кулланучылар көтүлектә җыелган вакытта, кибер-хакерлар DeepSeek кушымтасына туктаусыз һөҗүм итәләр, һәм аның серверларында зур кыенлыклар тудыралар. Промышленность аналитиклары бу өлешчә DeepSeek укыту өчен карточкалар урнаштыру белән бәйле, фикер йөртү өчен җитәрлек исәпләү көче җитми. Тармак инсайдеры AI Technology Review'ка хәбәр итте, "Серверның еш проблемаларын түләү яки күбрәк машиналар сатып алу өчен финанслау ярдәмендә җиңел чишеп була; ахыр чиктә бу DeepSeek карарларына бәйле." Бу производствога каршы технологиягә игътибарны арттыра. DeepSeek үз-үзен тәэмин итү өчен квант квантизациясенә таянды, тышкы финанслауны аз алган, нәтиҗәдә чагыштырмача түбән акча басымы һәм чиста технологик мохит. Хәзерге вакытта, югарыда телгә алынган проблемаларны исәпкә алып, кайбер кулланучылар DeepSeek-ны социаль челтәрләрдә куллану чикләрен күтәрергә яки кулланучылар уңайлыгын арттыру өчен түләүле функцияләр кертергә өндиләр. Моннан тыш, уйлап табучылар оптимальләштерү өчен рәсми API яки өченче як API-ларын куллана башладылар. Ләкин, DeepSeek ачык платформасы күптән түгел игълан итте, "Хәзерге сервер ресурслары бик аз, һәм API сервисын тулыландыру туктатылды."

 

Бу, һичшиксез, ЯИ инфраструктурасы өлкәсендә өченче як сатучылар өчен күбрәк мөмкинлекләр ача. Күптән түгел күпсанлы эчке һәм халыкара болыт гигантлары DeepSeek модель API-ларын эшләтеп җибәрделәр - гыйнвар ахырында беренчеләрдән булып Microsoft һәм Amazon чит ил гигантлары. Эчке лидер, Huawei Cloud, беренче адым ясады, 1 февральдә Кремний нигезендәге Flow белән берлектә DeepSeek R1 һәм V3 фикер йөртү хезмәтләрен чыгарды. Зур өч технология компаниясе - BAT (Байду, Алибаба, Тенсент) һәм ByteDance - шулай ук ​​3-нче февральдән аз бәяле, чикләнгән вакытлы тәкъдимнәр чыгардылар, узган елгы болыт сатучы бәя сугышларын хәтерләтә, DeepSeek-ның V2 моделе старт алган, анда DeepSeek "бәя касапчы" дип атала башлаган. Болыт сатучыларның аянычлы эшләре Microsoft Azure һәм OpenAI арасындагы элеккеге тыгыз бәйләнешне чагылдыра, монда 2019-нчы елда Microsoft OpenAI-га 1 миллиард доллар күләмендә инвестиция кертте һәм 2023-нче елда ChatGPT ачылганнан соң файда китерде. Ләкин бу тыгыз мөнәсәбәт Meta ачык Llamaдан соң бозыла башлады, бу Microsoft Azure экосистемасы читендәге башка сатучыларга зур модельләре белән көндәш булырга мөмкинлек бирде. Бу очракта, DeepSeek продукт җылылыгы ягыннан ChatGPT-ны узып калмады, o1 чыгарылганнан соң ачык чыганак модельләрен дә кертте, Лламаның GPT-3 яңарышындагы дулкынлануга охшаган.

 

Чынлыкта, болыт провайдерлары шулай ук ​​үзләрен ЯИ кушымталары өчен трафик шлюзлары итеп күрсәтәләр, димәк, уйлап табучылар белән элемтәләрне тирәнәйтү өстенлекле өстенлекләргә күчә. Докладлар шуны күрсәтә: Baidu Smart Cloud 15000-дән артык клиент булган, алар модельне эшләтеп җибәрү көнендә ianианфан платформасы аша DeepSeek моделен кулланган. Моннан тыш, берничә кечерәк фирма чишелешләр тәкъдим итә, алар арасында Кремний нигезендәге агым, Лючен технологиясе, Чуанцин технологиясе һәм DeepSeek модельләренә ярдәм күрсәткән төрле AI Инфра провайдерлары. AI Technology Review шуны белде: DeepSeek-ны локальләштерелгән урнаштыру өчен хәзерге оптимизация мөмкинлекләре беренче чиратта ике өлкәдә бар: берсе гибрид GPU / CPU инфраструктурасын кулланганда 671 миллиард параметр MoE моделен урнаштыру өчен катнаш фикерләү ысулы кулланып, MoE моделенең сирәк характеристикаларын оптимальләштерү. Моннан тыш, MLA оптимизациясе бик мөһим. Шулай да, DeepSeek'ның ике моделе урнаштыру оптимизациясендә кайбер проблемалар белән очраша. "Модельнең зурлыгы һәм күп санлы параметрлары аркасында оптимизация чыннан да катлаулы, аеруча җирле урнаштыру өчен, эш белән бәя арасында оптималь баланска ирешү авыр булачак", диде Chuanjing Technology тикшеренүчесе. Иң мөһим киртә - хәтер сыйдырышлыгы чикләрен җиңү. "Без үзәк эшкәрткеч җайланмаларны һәм башка исәпләү ресурсларын тулысынча куллану өчен гетероген хезмәттәшлек алымын кулланабыз, сирәк MoE матрицасының уртак булмаган өлешләрен үзәк эшкәрткеч җайланма операторлары ярдәмендә эшкәртү өчен үзәк эшкәрткеч җайланма / DRAMга урнаштырабыз, ә тыгыз өлешләр GPUда кала", - дип аңлатты ул. Докладлар шуны күрсәтә: Чуанцинның ачык чыганаклы KTransformers, нигездә, төрле стратегияләрне һәм операторларны шаблон аша оригиналь Трансформерлар кертүгә кертә, CUDAGraph кебек ысуллар кулланып, тизлекне сизелерлек арттыра. DeepSeek бу стартаплар өчен мөмкинлекләр тудырды, чөнки үсеш өстенлекләре ачыклана; күп фирмалар оптимизация эзләгән элеккеге клиентлардан сорау алгач, DeepSeek API эшләтеп җибәргәннән соң, клиентларның сизелерлек артуы турында хәбәр иттеләр. Промышленность инсайдерлары билгеләделәр: "Элек, билгеле бер клиент төркемнәре еш кына эре компанияләрнең стандартлаштырылган хезмәтләренә бикләнәләр иде, масштаблары аркасында аларның бәя өстенлекләре белән тыгыз бәйләнештә тордылар. Ләкин, язгы фестиваль алдыннан DeepSeek-R1 / V3 урнаштыруны тәмамлагач, без кинәт берничә танылган клиентның хезмәттәшлек соравын алдык, һәм хәтта йокыга киткән клиентлар безнең DeepSeek хезмәтләрен кертү өчен элемтәгә керештеләр." Хәзерге вакытта, күрәсең, DeepSeek модель инфраструктурасын тагын да критик итә, һәм зур модельләрне киңрәк кабул итү белән, бу AI Инфра индустриясе үсешенә сизелерлек йогынты ясаячак. Әгәр дә DeepSeek дәрәҗәсендәге модель җирле арзан бәядә урнаштырылса, бу хөкүмәткә һәм предприятиягә санлы трансформация эшләренә зур ярдәм күрсәтер иде. Ләкин, проблемалар дәвам итә, чөнки кайбер клиентлар зур модель мөмкинлекләренә зур өметләр баглый алалар, практик урнаштыруда эшне һәм бәяне баланслау мөһим булып күренә. 

DeepSeek ChatGPT-тан яхшыракмы-юкмы икәнлеген бәяләү өчен, аларның төп аермаларын, көчле якларын аңларга, очракларны кулланырга кирәк. Менә тулы чагыштыру:

Функция / аспект DeepSeek ChatGPT
Хуҗалык Кытай компаниясе тарафыннан эшләнгән OpenAI тарафыннан эшләнгән
Чыганак моделе Ачык чыганак Хуҗалык
Бәясе Куллану өчен бушлай; арзанрак API керү вариантлары Подписка яки куллану өчен түләү бәясе
Custзенчәләштерү Usersгары көйләнә торган, кулланучыларга аны төзәтергә һәм төзергә мөмкинлек бирә Чикләнгән көйләү мөмкинлеге бар
Конкрет биремнәрдә чыгыш ясау Мәгълүмат аналитикасы һәм мәгълүмат алу кебек кайбер өлкәләрдә өстенлек Иҗади язуда һәм сөйләшү биремнәрендә көчле күрсәткеч белән күпкырлы
Тел ярдәме Кытай теленә һәм мәдәниятенә нык игътибар Киң тел ярдәме, ләкин АКШ-үзәк
Укыту бәясе Түбән уку чыгымнары, эффективлык өчен оптимальләштерелгән Trainingгары уку чыгымнары, зур исәпләү ресурслары таләп итә
Variавап үзгәрү Төрле җаваплар бирергә мөмкин, мөгаен, геосәяси контекст тәэсирендә Укыту мәгълүматларына нигезләнеп эзлекле җаваплар
Максатлы аудитория Эшчәнлекне теләгән уйлап табучыларга һәм тикшерүчеләргә Сөйләшү мөмкинлекләрен эзләүче гомуми кулланучыларга юнәлтелгән
Эшләрне кулланыгыз Код ясау һәм тиз биремнәр өчен тагын да эффектив Текст ясау, сорауларга җавап бирү, диалогта катнашу өчен идеаль

"Нвидияне бозу" буенча критик перспектива

Хәзерге вакытта, Huawei -тан кала, Мур җепләр, Мукси, Биран Технологиясе һәм Тяньцу Жиксин кебек берничә көнкүреш чип җитештерүчеләре дә DeepSeekның ике моделенә яраклаша. Чип җитештерүче AI Technology Review-га әйтте, "DeepSeek структурасы инновацияне күрсәтә, ләкин ул LLM булып кала. Безнең DeepSeek белән адаптация, нигездә, заявкаларны куллануга юнәлтелгән, техник тормышка ашыруны гади һәм тиз ясый." Ләкин, ЭЭМ алымы саклау һәм тарату ягыннан югары таләпләр таләп итә, шулай ук ​​көнкүреш чиплары белән эшләгәндә яраклашуны тәэмин итү, адаптация вакытында чишелешкә мохтаҗ булган күп инженерлык проблемаларын тәкъдим итү. "Хәзерге вакытта эчке исәпләү көче Nvidia белән куллану һәм тотрыклылык белән туры килми, программа мохитен урнаштыру, проблемаларны чишү һәм төп эшне оптимизацияләү өчен заводта катнашуны таләп итә", диде практик тәҗрибәгә нигезләнеп. Шул ук вакытта, "DeepSeek R1 зур параметр масштабы аркасында, эчке исәпләү көче параллельләштерү өчен күбрәк төеннәр таләп итә. Өстәвенә, эчке җиһаз спецификасы әле бераз артта кала; мәсәлән, Huawei 910B хәзерге вакытта DeepSeek керткән FP8 инференциясен хуплый алмый." DeepSeek V3 моделенең төп вакыйгаларының берсе - FP8 катнаш төгәллекне өйрәнү базасын кертү, ул бик зур модельдә эффектив расланган, зур казанышны күрсәтә. Элегерәк, Майкрософт һәм Nvidia кебек төп уенчылар бәйләнешле эш тәкъдим иттеләр, ләкин мөмкинлекләр турында тармакта шик бар. Аңлашыла ки, INT8 белән чагыштырганда, FP8-нең төп өстенлеге шунда ки, тренингтан соң квантлаштыру югалтуларсыз төгәллеккә ирешә, шул ук вакытта инфраструктура тизлеген сизелерлек арттыра. FP16 белән чагыштырганда, FP8 Nvidia H20да ике тапкыр тизләнүне һәм H100да 1,5 тапкыр тизләнүне тормышка ашыра ала. Шунысы игътибарга лаек, эчке исәпләү көче һәм эчке модельләр тенденциясе тирәсендәге дискуссияләр көчәя барган саен, Nvidia бозылырга мөмкинме, һәм CUDA диңгезе үтеп китә аламы дигән фаразлар көннән-көн киң тарала бара. Бер бәхәссез факт - DeepSeek чыннан да Nvidia базар бәясенең сизелерлек төшүенә китерде, ләкин бу смена Nvidia-ның югары исәпләү көченең бөтенлегенә кагылышлы сораулар тудыра. Элегерәк капитал белән исәпләү туплау турындагы кабул ителгән хикәяләргә каршы торалар, ләкин Nvidia өчен укыту сценарийларында тулысынча алышыну кыен. DeepSeek-ның CUDA-ны тирән куллануына анализ шуны күрсәтә: сыгылучанлык, мәсәлән, SM-ны элемтә өчен куллану яки челтәр карталарын турыдан-туры манипуляцияләү - гадәти GPU-ларда урнашу мөмкин түгел. Промышленность карашлары ассызыклый, Nvidia диңгезе CUDA үзе генә түгел, бөтен CUDA экосистемасын үз эченә ала, һәм DeepSeek кулланган PTX (Параллель җепне башкару) күрсәтмәләре әле дә CUDA экосистемасының өлеше булып тора. "Кыска вакыт эчендә, Nvidia-ның исәпләү көче узып китә алмый - бу укытуда аеруча ачык; ләкин, карточкаларны уйлау өчен куллану җиңелрәк булыр, шуңа күрә алгарыш тизрәк булыр. Эчке карталарның адаптациясе беренче чиратта төп игътибарны үзләштерә; Гомумән алганда, эчке эре модель чиплар өчен шартлар дәртләндерә. Эчке чип җитештерүчеләр өчен мөмкинлекләр, тренировкаларның чиктән тыш югары таләпләре аркасында ачык күренә, керүгә комачаулый. Аналитиклар көнкүреш карточкаларын куллану гына җитә дип саныйлар; кирәк булса, өстәмә машина алу мөмкин, ә укыту модельләре уникаль проблемалар тудыра - күп санлы машиналар белән идарә итү авыр булырга мөмкин, һәм хаталарның югары булуы укыту нәтиҗәләренә тискәре йогынты ясарга мөмкин. Тренинг шулай ук ​​кластер масштаблы таләпләргә ия, шул ук вакытта кластерларга таләпләр катгый түгел, шулай итеп GPU таләпләрен җиңеләйтә. Хәзерге вакытта Nvidia-ның бердәнбер H20 картасы Huawei яки Cambrianныкыннан артмый; Аның көче кластерда. Хисаплау энергиясе базарына гомуми йогынтыдан чыгып, Лючен Технологиясенә нигез салучы Сез Ян, AI Technology Review белән интервьюда, "DeepSeek ультра-зур укыту исәпләү кластерларын булдыру һәм арендага алу вакытлыча бозылырга мөмкин. Озакламый, зур модель тренинглары, фикер йөртүләр һәм кушымталар белән бәйле чыгымнарны сизелерлек киметеп, базар таләбе дәвам итәчәк. Өстәвенә, "DeepSeek-ның фикер йөртүгә һәм яхшы көйләү хезмәтләренә булган ихтыяҗы эчке исәпләү пейзажына туры килә, монда җирле куәтләр чагыштырмача зәгыйфь, кластердан соң буш ресурслардан калдыкларны йомшартырга булыша; бу эчке исәпләү экосистемасының төрле дәрәҗәләрендә җитештерүчеләр өчен уңайлы мөмкинлекләр тудыра." Luchen Technology Huawei Cloud белән DeepSeek R1 серияле фикер йөртү API-ларын һәм эчке исәпләү көченә нигезләнгән болыт күзәтү хезмәтләрен җибәрү өчен хезмәттәшлек итә. Сез Ян киләчәккә оптимизм белдердегез: "DeepSeek илдә җитештерелгән чишелешләргә ышаныч уята, алга таба зур энтузиазм һәм эчке исәпләү мөмкинлекләренә инвестицияләр кертә."

微信图片 _20240614024031.jpg1

Йомгаклау

DeepSeek ChatGPT-тан "яхшырак" булу-булмау кулланучының конкрет ихтыяҗларына һәм максатларына бәйле. Эчлек, аз бәя, көйләүгә мохтаҗ булган биремнәр өчен DeepSeek өстен булырга мөмкин. Иҗади язу, гомуми тикшерү, кулланучылар өчен аралашу интерфейсы өчен ChatGPT беренчелекне алырга мөмкин. Eachәрбер корал төрле максатларга хезмәт итә, шуңа күрә сайлау алар кулланылган контекстка бәйле булачак.

ELV кабель чишелешен табыгыз

Контроль кабельләр

BMS, BUS, индустриаль, инструменты кабель өчен.

Структуралаштырылган кабель системасы

Челтәр һәм мәгълүмат, җепсел-оптик кабель, пач шнуры, модульләр, бит

2024 Күргәзмәләр һәм вакыйгаларга күзәтү

16-18 апрель, 2024 Дубайда Якын Көнчыгыш-Энергия

16 апрель, 1824, 2024 Мәскәүдә Секурика

9 май, 2024 Я NEWА Продуктлар һәм Технологияләр Шанхайда ачыла

22-25-25 октябрь, Пекинда Куркынычсызлык Китай

1924 елның 20 ноябре


Пост вакыты: 10-2025 февраль