"Дөньяда иң акыллы" таркала

Aipu waton төркеме (1)

Кереш

ГРОК3 әзерләнгән модельләрнең "ахыры" булачак дип уйлыйсызмы?

Элон Маск һәм Сай командасы рәсми рәвештә Грок, Лок3, тере-тере чорда иң соңгы версиясен эшләтеп җибәрде. Бу вакыйга алдыннан бик күп күләмдә бәйләнешле мәгълүмат, мускулның 24/7 реклама Hype белән кушылып, глок3 белән эленекцияләнгән дәрәҗәләргә күтәрелде. Бер атна элек Мобус тере-территориядә ышаныч белән әйтелә, "Синай яхшырак AI моделен башларга җыена". Тәкъдим ителгән мәгълүматлардан, грук3 математика һәм программалаштыру модельләрен өч ел эчендә өч ел эчендә фаразлау биремнәре өчен кулланылачак. " Ләкин, алар хәзерге вакытта мускул сүзләре генә. Эштән соң мин грок3 соңгы бетет версиясен сынап карадым һәм зур модельләр өчен классик хәйлә сорады: "Зур, 9.11 яки 9,9?" Кызганычка каршы, бернинди квалификациясез яки билгесез, иң акыллы грук3 әле дә бу сорауга дөрес җавап бирә алмады. Грок3 сорауның мәгънәсен төгәл белә алмады.

 

Бу сынау тиз арада күп дуслардан зур игътибарны җәлеп итте, һәм тәлинкәләр чит илләрдә төрле физик физика / математика буенча көрәшәләр, бу туп пиза манарасы белән иң элек. " Шулай итеп, "гади сорауларга җавап бирергә теләмәгән" дип аташтырылган.

640

Grok3 яхшы, ләкин бу R1 яки O1-Продан яхшырак түгел.

Гадәттәгечә күп уртак белем тестларында грук3 тәҗрибәле «уңышсызлык» кичерде. Саво җибәрү вакытында мускул GROK3-ны сөргенең уен юлыннан анализлау өчен Грок3 ярдәмендә күрсәтте, ул еш уйный, ләкин грок3 каралган күпчелек җаваплар дөрес булмаган. Тере агым вакытында муск бу ачык проблеманы сизмәде.

 

Бу хата, уенда "алмаштыруны табу өчен" мускулны мыскыллау өчен, "алмаштыргыч" өчен мускулны мыскыллау өчен өстәмә нетизация өчен өстәмә дәлилләр күрсәтелми, киресенчә, Грок3 практик кушымталарда ышанычлылыкка кагылышлы мөһим борчылулар күтәрелде. Мондый "гений" өчен, Марс разведка биремнәре кебек бик катлаулы заявкалау сценарийлары өчен, шикле кала.

 

Хәзерге вакытта Грок3 атна элек модель мөмкинлекләрен алган күп, модель мөмкинлекләрен алганнар, барысы да уртача нәтиҗә ясау өчен, "Грок3 яхшы түгел, ләкин бу R1 яки O1-RO-тан яхшырак түгел."

640 (1)

"NVIDIAны бозу" буенча критик перспектива

Чыгарылыш вакытында PPT тәкъдим ителгән PPT күрсәтелде, ләкин бу чиста кулланыла торган график техника 1400-1300 балллы нәтиҗәләр күрсәтелде, бу презентациядә оригиналь 1% аерма, бу презентациядә иң мөһиме.

640

Модель балл нәтиҗәләрендә GROK3 Depseeek R1 һәм GPT-4.0 алдыннан 1-2% алда, алар "ачыктан-ачык аерма" дип табылган практик тестларның практик тестларында туры килә. Grok3 аның варисларын 1% -2% ка арттыра.

640

Grok3 хәзерге вакытта халык алдында сынап караган модельләргә караганда югарырак булса да, күпләр моны җитди кабул итмиләр, Кадрий моңа кадәр "балл манипуляциясе" өчен тәнкыйтьләнә. Лаффард штрафлы җавап стиле буларак, исәпләр бик кимегән саен, әйдәп баручы тармак индустриячеләр "югары туплау, ләкин түбән сәләт" феноменын еш тәнкыйтьләү өчен.

 

Илдәбәсендә "манипуляция" лидеры яки иллюстрацияләрдә дизайн хәйләләре дигәнме, алар модель мөмкинлекләрдәге "пакетны басып торган" ның "пакетын" нең төшенке белән ачалар. Маск бу марҗиналар өчен тик бәя түләде: Ливер вакытында ул 200,000 H100 GPUS куллану белән мактанды (100,000 артык "лип аша (100,000 дән артык" таләп итә һәм 200 миллион сәгатьлек гомуми күнегү вакытына ирешә. Бу кайберәүләрне GPU сәнәгате өчен ул тагын бер мөһим вакыйга белән күрсәтә һәм тирән секторга "ахмаклык" дип саный торган ышанды. Шунысы игътибарга лаек, кайберәүләр исәпләү көчене модель тренингның киләчәге булыр дип ышаналар.

 

Ләкин, кайбер нетизон 2000 H800 GPUSE белән тулган ике ай эчендә, грук3 практиканы куллануның 263 тапкысына исәпләнгән. 1402 балл җыйган, грук3 100 баллга кадәр аерылып торган аерма. Бу мәгълүматлардан соң күпләр GROK3 исеме артында "дөньяның иң көчлесе" барлыгын тиз аңладылар - зуррак модельләр кими бара, көчлерәк эш күрсәтелә башлады.

640 (2)

"Highгары туплау, ләкин түбән сәләт" белән дә хәтта X (Twitter) платформасыннан X (Твиттер) платформасыннан зур күләмле беренче партия мәгълүматлары булган. Ләкин, Грок3 тренингында XIA "Түгәрәк" табигый рәвештә "түшәм" табигый белән очрашты - премиум тренинг мәгълүматлары җитмәү модельнең мөмкинлекләренең маргиналь коммунальлекне фаш итә.

 

Грок3 һәм Маск уйлап табучылар, мөгаен, бу фактларны тирән аңларлар, шуңа күрә мускул социаль медиа-да ачыктан-ачык искә алына, шуңа күрә мускул "Бета", "киләсе айларда" тулы версиясе чыгарылачак ". Маск Грок3 продукт менеджер ролен кабул итте, кулланучыларга аңлатмалар бүлегендә булган төрле сораулар буенча җавап бирергә тәкъдим итеп. Ул җирдә иң соң продукт менеджеры булырга мөмкин.

 

Ләкин, бер көн эчендә, GROK3 спектакле, һичшиксез, "зур исәпләү мускуллары", шуңа күрә Microsoft мәгълүматларына нигезләнеп сигнализация күтәргән кешеләр өчен сигнализация күтәрелгәннәр өчен сигнализация күтәрелде, Openai's GpriLen'ның параметры, ун тапкыр артык GPT-3 белән. Имомнар GPT-4.5 параметры хәтта зуррак булырга мөмкин.

 

Модель параметры зур күләмдә, тренинг чыгымнары да күктә. GRT3 булганда, GPT-4.5 кебек, "яндыру акчаны", парометриягә ирешү өчен "яндыру акцияләрен" дәвам итәргә теләгән кешеләр, бу түшәмне хәзер ачыктан-ачык җиңәргә һәм аны ничек җиңәргә икәнлеген уйларга тиеш. Бу мизгелдә Опанайда элеккеге баш фәни галим беренче декабрьдә алдан әйтелгәнчә, "Без тренинг" дискуссияләрдә яңадан торгызылган, зур модельләрне әзерләү өчен чын юлны табарга этәрә.

640 (3)

Ильяның карашы тармакта сигнализация яңгырады. Ул уңайлы яңа мәгълүматларның якынлашып килә торган яңа мәгълүматларның бетүен бик алдан күрде, бу ситуациягә алып бара, спектакльнең казылма ягулыгы бетүенә караганда, эш алу белән чагыштыруны дәвам итә алмый. Ул "Нефтьтә, Интернетта кеше тарафыннан ясалган эчтәлек кебек кеше кебек, чикләнгән ресурс." Суцкеверның фаразлары, киләсе буыны модельләрендә, алдан уклау "чын автономия" һәм "чын автономия" булырга тиеш ".

 

Бүгенге көнгә кадәр эчтәлеккә туры килгән алдан ук әзерләнгән модельләрдән аермалы буларак, булачак AI системалары кеше миенең «уйлау» ны чишү өчен методикалар булдыра алачак. Кеше төп профессиональ әдәбиятлы предметка төп профессиональ әдәбиятка ирешә ала, ә AI зур моделе иң төп керү дәрәҗәсе эффективлыгына ирешү өчен миллионлаган мәгълүмат баллларын таләп итә. Сүз бераз үзгәргәндә дә, бу төп сорауларны дөрес аңламаса да, модель интеллектада чын күңелдән искә алынмас сораулар бу күренешнең ачык мисалын күрсәтәләр.

微信图片 _20240614024031.jpg1

Йомгаклау

Ләкин, рәхимсез көчтән тыш, рәхимсез көчтән тыш, чыннан да сәнәгатьне ачыкласа, бу өлкә өчен зур нәтиҗәләр бирәчәк.

Грок3 әкренләп басып торганнан соң, без Fei-Fei Li кебек, без FiE-Fei Li кебек, ахыр чиктә Агигә чын юлны ачу.

Эльв кабель чишелешен табыгыз

Контроль кабельләр

BMS, автобус, сәнәгать, инструкторация кабель өчен.

Структуралаштырылган кабель системасы

Челтәр һәм мәгълүматлар, җепсел-оптик кабель, пач шнур, модульләр, фабрик

2024 Күргәзмә һәм вакыйгалар карау

АПР.16 - 18, 2024 Дубайдагы 2024 урта-энергия

АПР.16 - 1824 секурика Мәскәүдә

Шанхайда 2024 яңа продукт һәм технологияләр җибәрү вакыйгасы

Пекинда узган 1224, 2524 куркынычсызлык Кытай

20-20 ноябрь, 2024 Бәйләнешле дөнья KSA


Пост вакыты: 19-2025 февраль