Deepseek: AI ландшафтын революцияләү

AIPU Waton Group

Кереш

Зур модельләрне, Болыт провайдерлары арасында, базар провайдерлары арасында катнашу, һәм эш сөючәннәр өчен көч сынаша - Deepseek эффект дәвам итә.

Яз фестивалье якынлашканда, тирән тирәнлектә дулкынлану көчле булып кала. Соңгы бәйрәм технологиясе кысаларында мөһим көндәшлек хисе күрсәтте, күпләр, бу "мәче балык" турында сөйләшәләр һәм анализлау. Кресний үзәнлеге кризисның моңарчы күрелмәгән кризис хисләрен кичерә: ачык чыганак яклаучылары кабат-фикер уртаклаша, хәтта ачуы дә ябык чыганак стратегиясен иң яхшы сайлау булса да, яңадан бәяләнә. Түбән исәпләү чыгымнарының яңа басмаларының яңа парлары Нвидия кебек чип гиганы арасында чип гигантлары арасында чылбыр ригасын селкенде, бер көнлек базар кыйммәте арасында, дәүләт органнары тирәнлектә кулланылган чипларның үтәлешен тикшерә. Оперсе чит илләрнең катнаш рецензияләре арасында, эчке яктан, ул гадәттән тыш үсеш кичерәләр. R1 моделен эшләтеп җибәргәннән соң, бәйләнешле кушымта куллану тармакларында үсеш өлкәләрендә үсешне алга таба алып барганын күрсәтә. Позитив аспект - тирәнлек куллануны мөмкинлекләр киңәйтәчәк, шатгвтка таяну киләчәктә дә шулай булмас дип тәкъдим ителә. Бу смена Опанайның соңгы эшчәнлегендә чагылыш тапты, шул исәптән D3 Mini бушлай кулланучыларга, шулай ук ​​o3 Мини җәмәгатьчелекнең фикер йөртүен ясаган яңартулар. Күпчелек чит илләрдә кулланучылар бу вакыйгалар өчен тирәнлеккә рәхмәт белдерделәр, гәрчә бу уй чылбыры кыскача хезмәт итә.

Оптимист, Deviseek берләшүче йорт уенчылары булуын күрми. Тренинг чыгымнарын киметеп, төрле агымдагы агымдагы чип җитештерүчеләре, арадаш allyгары стартаплар, күп санлы стартаплар тирәнлек моделен куллану өчен бәянең эффективлыгына актив катнашалар. Depseeek түләгәнчә, V3 модельен тулысынча әзерләү 2,788 миллион H800 GPU сәгать таләп итә, һәм укыту процессы бик тотрыклы. Моле (экспертлар катнашмасы) архитектурасы 405 миллиард параметр белән чагыштырганда, Ллама парларын чагыштырганда унга кадәрге чыгымнарны киметү өчен бик мөһим. Хәзерге вакытта V3 - MOEда мондый югары булмаган әйберләрне күрсәтүче беренче ачык танылган модель. Өстәвенә, MLA (күп катламлы игътибар) синхрегистик эшли, аеруча фикер йөртү аспектлары. "КВКА акчаны тулысынча кулланганда, КВКА акчаны тулысынча кулланырга тиеш. MLA KVCAHe зурлыгын сизелерлек саный", дип билгеләп үтте Ай технологияләрен карау өчен анализ. Гомумән, тирәнлек уңышлары бер генә гына түгел, төрле технологияләр кушылмавында тора. Индустрия индустрия Команда инженерлык мөмкинлекләрен, параллель тренировкаларны оптимальләштерү өчен, һәр детальне чистарту белән җирәнгеч нәтиҗәләргә ирешүне башлап җибәргән өстенлекләрен яулап кабул итәләр. Deepseekның ачык чыганак кабинеты алга таба ягулыкта зур модельләр үсеше, һәм ул индустрия буенча шундый ук модельләр үзгәртелә, бу тармакта ихтыяҗны арттырачак.

Өченче якның фикер йөртү хезмәтләре өчен мөмкинлекләр

Мәгълүматлар күрсәтә: Чатгптның кулланучысы 7,15 миллионнан артык актив кулланучылар (DAU) Дубао белән 16,95 миллионнан артык актив кулланучыга ирешү, шулай итеп 157 илдә / төбәктә Apple App Store кибетенә әйләнеп кайтты. Ләкин, кулланучылар чыбыкларда агып китәләр, киберләр хакерлар, киберләр хакерлар тирән кушымтага туры килми, аның серверларына әһәмиятле кыенлыклар тудыра. Сәнәгать аналитиклары бу өлешчә тирәнек белән тренинглар белән тренингны урнаштырган вакытта, фикер йөртү көче җитми. AI технологияләрен карау өчен сәнәгать инсайдеры хәбәр иткәнчә, "Еш сервер проблемалары зарядка түләүләре яки финанслау белән җиңел чишелергә мөмкин; ахыр чиктә бу тирән карарларына бәйле." Бу продуктларга каршы технологиягә игътибар итүдә сәүдә белән сәүдә итә. Deepseek үз-үзеңне тоту өчен санлы саннан санады, кечкенә тышкы финанслау, нәтиҗәдә чагыштырмача аз күләм басымы һәм саф технологик мохит нәтиҗәсе. Хәзерге вакытта, югарыда күрсәтелгән проблемалар нигезендә, кайбер кулланучылар социаль медиа-массакүләм мәгълүмат чараларында куллану бусага күтәрү яки кулланучы юанычын арттыру өчен түләүле үзенчәлекләр кертергә өндәп торалар. Өстәвенә, уйлап табучылар оптимизация өчен рәсми API яки өченче як-партия аписларын куллана башладылар. Ләкин, күптән түгел тирән платформа күптән түгел игълан ителде ", - дип игълан ителде" Хәзерге сервер ресурслары бик аз, һәм api хезмәтләре тулипәйтелде. "

 

Бу, һичшиксез, AI инфраструктурасында өченче як сатучылар өчен күбрәк мөмкинлекләр ача. Күптән түгел, күпсанлы көнкүреш һәм халыкара болыт гигантлары Гыйнвар Майкрософт һәм Амазон беренче булып гыйнвар ахырында кушылды. Эчке лидер, Хувей болыты, 1 февральдә кремнийга нигезләнгән depseek r1 һәм V3 фикер йөртүе докладлары сымлы агымдагы хезмәтләрне күрсәткән, платформаны эффектив "җимерелә". Зур өч технологияле компания (Байду, Алибаба, Тенсент) һәм Биптартлар - Соңгы еллык болытлы тәкъдимнәр, узган елгы болыт сатучылары, депсейдның V2 моделе җибәрү сугышы, анда Deepseek "бәя кранчы" дип атый башлады. Болыт сатучыларның төп чаралары Microsoft Microse Microsect-ны 2023-нче елда элегрәк тәшкил итә. Ләкин, Microsoft Microsoft Microsoft Ecosistem белән өстенлек бирде, алар арасында Microsoft Azure ecosysteсәм тыш сатучыларына зур модельләр белән көндәш булырга мөмкинлек бирде. Бу очракта Deeceeeek продукт җылылык ягыннан бер тапкыр гына түгел, ә o1 чыгарылышыннан соң ачык чыганак модельләрен кертте, LLAMA-3 LLAMA-3 LLAMA-ны әйләндереп алган.

 

Чынлыкта, болыт провайдерлары шулай ук ​​үзләре AI кушымталары өчен юл каплавы итеп, уйлап табучылар белән мөнәсәбәтләрне тирәнтен тирәнәйтү дип саныйлар. Докладлар күрсәтәләр Моннан тыш, берничә кечерәк фирма чишелешләр тәкъдим итә, шул исәптән кремний нигезендәге агым, лучен техникасы, chaanjing технологияләре, һәм тирән модельләр өчен ярдәм башлаган төрле AI инжационерлар. AI технологияләрне карау, беренче чиратта, тирән оптимизацияләү мөмкинлекләре, беренче чиратта, MOE моделенең гибрид GPU / CPU конференциясе ярдәмендә формаль рәвештә оптимальләштерүне белде. Моннан тыш, MLA оптимализациясе бик мөһим. Ләкин, Deecheeekның ике моделье оптимизация урнаштыруда кайбер кыенлыклар белән очрашалар. "Модельнең күләме һәм күп параметрлары аркасында оптимизация спектакль белән чыгымнар арасында оптималь баланска ирешү авыр булачак", - диде Чуанжинг технологиясеннән тикшерүче. Хәтернең хәтер көчене җиңеләйтү. "Без CPUS һәм башка исәпләү ресурсларын тулысынча куллану өчен гетероген хезмәттәшлек итү алуны кабул итәбез, CPU / CPU операторларын эшкәртү өчен Сары булмаган режимның уртак булмаган өлешләрен куеп, тыгыз өлешләр GPUда калалар", - дип алданек. Докладлар күрсәтәләр, Чуманьның ачык чыганаклары кассалары крансформерлары шаблон кебек трансформаторлар аша төрле стратегияләр һәм операторларны тормышка ашыралар, "Кудаграф кебек методларны ачу тизлеген күрсәтә. Depseek бу стартаплар өчен мөмкинлекләр булдырды, чөнки үсеш файдалары ачыклана; Күпчелек фирмалар төгәл клиент үсеше Depseek API эшләтеп җибәргәннән соң, Depseek API ачылганнан соң, элеккеге клиентлардан сораштырылган сораулар алу турында хәбәр иттеләр. Сәнәгатьтә индустрияләр әйттеләр, "Элек кечкенә компанияләрнең стандартлаштырылган хезмәтләре белән бәйләнгәннән соң, без кинәт зурланган клиентларның стандартлаштырылган хезмәтләренә тупланганнан соң, хәтта элек йокысыз клиентлар безнең тирән хезмәтләребызны кертү өчен контактлар башлыйбыз." Хәзерге вакытта тирәнлектәге модельле эш күрсәтелә, һәм күп зур модельләр белән киң, бу AI интермоститорда үсеш тәэсирен сизелер. Әгәр дә тирән дәрәҗәдә модельне түбән бәядә урнаштырылса, ул дәүләткә һәм хакимияткә зур ярдәм итәр иде, бу зур ярдәм булыр иде. Ләкин, кыенлыклар дәвам итә, чөнки кайбер клиентлар зур модель мөмкинлекләренә кагылышлы зур дәрәҗәдә зур өметләр баглый, ачыкланып, практик урнаштырганда, ачык, ачык күренә. 

Deepseke Chatgtpt-тан яхшыракмы, аларның төп аермаларын, көчләрен һәм очракларын аңларга кирәклеген бәяләү мөһим. Менә комплекслы чагыштыру:

Функция / аспект Depseek Шактег
Милек Кытай компаниясе тарафыннан эшләнгән Операнай тарафыннан эшләнгән
Чыганак моделе Ачык чыганак Милек
Бәясе Кулланырга бушлай; CEARER API керү вариантлары Подписка яки түләү өчен түләү
Көйләү Кулланучыларга җибәрелә торган бик көйләнә торган һәм аның өстендә төзелгән Чикләнгән көйләү бар
Конкрет биремнәрдә башкару Мәгълүмат аналитикасы һәм мәгълүмат алу кебек кайбер өлкәләрдә өстенрәк Иҗади язу һәм сөйләшү биремнәрендә көчле эш белән бик күпкырлы
Тел ярдәме Кытай теленә һәм культурасына ныклы игътибар АКШ-центрикның киң теле ярдәме
Укыту бәясе Эффективлык өчен түбән укыту чыгымнары Югары уку ресурсларын таләп итү, зур исәпләү ресурсларын таләп итә
Җавап бозыклыгы Төрле җаваплар тәкъдим итә ала, мөгаен, геосәяси контекст тәэсир итә Укыту мәгълүматлары нигезендә эзлекле җаваплар
Аудитория Уйлап табучыларга, тикшерүчеләргә сыгылучыга юнәлтелгән Генераль кулланучыларга ирешү
Эшләрне кулланыгыз Буын һәм тиз биремнәр өчен эффективрак Сорау тудыру, сорауларга җавап бирү, һәм диалог белән шөгыльләнү өчен текст ясау өчен идеаль

"NVIDIAны бозу" буенча критик перспектива

Хәзерге вакытта Хувейдан кала, Мур җепләре, Muxi, BERран технологияләре, Тянексу Жиксин шулай ук ​​DeiSeeekның ике модельенә җайлаштырылган. Чип җитештерүче AI технологияләр рецензиясенә инновацияне күрсәтә, ләкин ул беренче чиратта. Ләкин, моңлы караш саклау һәм бүлү ягыннан югары таләпләр таләп итә, эчке чипсы белән туры килүне тәэмин итә, адаптация вакытында күп компенсация проблемаларын чишүдә. "Хәзерге вакытта көнкүрешле исәпләү көче NVIIIA-ны протестл һәм тотрыклылыкка туры килми, төп завод программа тәэминаты, оештыру практикасы оптимизациясе" практик тәҗрибәгә нигезләнеп. Шул ук вакытта, Deepseeek R1 зур параметры, эчке исәпләү көче күптән, эчке җиһазлар спектрлары аркасында бик аз, чөнки Huawei 910b хәзерге вакытта DeeWeeek тарафыннан кертелергә мөмкин түгел. " Deepseeek V3 моделенең төп вакыйгаларының берсе - FP8 катнаш катнашы-тренинг кертү, зур зур модельдә эффектив тормышка ашырыла, зур уңышларга багышланган. Элегерәк Microsoft һәм Nvidia кебек зур уенчылар бәйләнешле эшләргә тәкъдим итте, ләкин шикләнеп тармак эчендә озак торалар. INT8 белән чагыштырганда, FP8 төп өстенлеге белән чагыштырганда, тренингтан соң тоннизацияләнгән санны югалтуга ирешә ала, эчке төгәллекне сизми торган тизлекне сизә. FP16 белән чагыштырганда, FP8 NVIDIA H20-ның H100-дән артык вакыт тизләтүен һәм 1,5 тапкыр тизләтергә мөмкин. Шунысы игътибарга лаек, эчке исәпләү көчеп, эчке модельләр моментлы фикерләр. Бер бәхәсле факт - тирәнлек Нвидиянең базар кыйммәтендә зур төшү сәбәпле, ләкин бу смена Нвидиянең югары бәяле көч сафлыгы турында сораулар тудыра. Элегерәк капитал белән идарә ителгән исәпләү туплау буенча кабул ителгән хикәяләр шикләнә, ләкин Нвидиягә тулы укыту сценарийларын тулысынча алыштырырга авыр кала. Cudexның тирән кулланылышын анализлау - кирәк-яраклылыкны аңлау, мәсәлән, аралашу яки турыдан-туры манифуляцияләү өчен см куллану кебек, регуляр GPUS урнаштыру мөмкин түгел. Сәнәгать караклыклары NVIDIAның сазлыкына Куда үзе түгел, ә PTX (параллель җеп үтәү) инструкцияләре, PTX (параллель җеп үтәү). "Кыска вакыт эчендә Нвидиянең исәпләү көченә, фикер йөртү бик ачык. Ләкин эчке карталарыгыз. Гомумән алганда, инференция күзлегеннән, шартлар эчке зур модель чипларын дәртләндерә. Эчке чип җитештерүчеләре эчендә эчке чип җитештерүчеләре өчен мөмкинлекләр, тренингның артык югары таләпләренә комачаулый торган мөмкинлекләр аркасында күбрәк ачык күренә. Аналитиклар көнкүрештән тыш карточкаларны гына җиткерәләр; Кирәк булса, өстәмә машина алу мөмкин булса, укыту модельләре уникаль проблемалар тудыра, машиналар саны арттыру авыр булырга мөмкин, һәм югары хата ставкалары күнегүләргә тискәре йогынты ясарга мөмкин. Тренинг шулай ук ​​конкрет кластер масштабы таләпләренә ия, ә инференция өчен кластерларның таләпләре сызык кебек түгел, шулай итеп GPU таләпләре. Хәзерге вакытта Нвидиянең бердәнбер H20 картасының эше Huawei яки Кембрианнан артмый; Аның көче кластерланган. Хисап электр энергиясе базарына гомуми йогынты ясау, Лутия технологиясенә нигез салучы, "Depseeke Unevise-ны вакытлыча киметергә мөмкин", - диде Depseeke. Базарның ихтыяҗы зур. Шуңа күрә исәпләү электр базарында өзлексез тәэмин ителергә тиеш. " Өстәвенә, "Depseeek фикер йөртүгә һәм яхшы көйләү хезмәтләре чагыштырмача киң таралырга тиеш, анда җирле мөмкинлекләрне буш ресурслардан файдаланырга булышалар; Бу җитештерүчеләр өчен эчке исәпләү экосистемасының төрле дәрәҗәләре буенча яшәү мөмкинлекләрен тудыра." Лучен технологиясе Huawei Clak белән хезмәттәшлек итә, Deexeeek R1 сериясе белән хезмәттәшлек итү, эчке исәпләү көче нигезендә, болыт сурәтләү хезмәтләре. Сез киләчәк турында оптимизм тормышка ашырдыгыз: "Depseeke эчке җитештерелгән чишелешләргә ышаныч, эчке җитештерелгән чишелешләргә ышаныч, зур исәпләү мөмкинлекләренә зуррак дәрт һәм инвестицияләр алга бара."

微信图片 _20240614024031.jpg1

Йомгаклау

Veepsek ChatGPT караганда "яхшырак", кулланучының конкрет ихтыяҗларына һәм максатларына бәйле. Биремнәр өчен сыгылучан, аз чыгымлы, һәм көйләү кирәк, тирән булырга мөмкин. Иҗади язу, гомуми тикшерү, һәм кулланучыларга уңайлы сөйләшү өчен, шатгпт беренчелекне ала ала. Eachәр корал төрле максатларда хезмәт итә, шуңа күрә сайлау алар кулланылган контекстка бәйле.

Эльв кабель чишелешен табыгыз

Контроль кабельләр

BMS, автобус, сәнәгать, инструкторация кабель өчен.

Структуралаштырылган кабель системасы

Челтәр һәм мәгълүматлар, җепсел-оптик кабель, пач шнур, модульләр, фабрик

2024 Күргәзмә һәм вакыйгалар карау

АПР.16 - 18, 2024 Дубайдагы 2024 урта-энергия

АПР.16 - 1824 секурика Мәскәүдә

Шанхайда 2024 яңа продукт һәм технологияләр җибәрү вакыйгасы

Пекинда узган 1224, 2524 куркынычсызлык Кытай

20-20 ноябрь, 2024 Бәйләнешле дөнья KSA


Пост вакыты: Февраль-10-2025