Кереш сүз

Сезнеңчә, Grok3 алдан әзерләнгән модельләрнең "соңгы ноктасы" булырмы?

Элон Маск һәм xAI командасы турыдан-туры эфир вакытында Grok, Grok3-ның соңгы версиясен рәсми рәвештә эшләтеп җибәрделәр. Бу вакыйгага кадәр, бик күп бәйләнешле мәгълүмат, Маскның 24/7 реклама хиты белән бергә, Grok3 өчен глобаль өметләрне моңарчы күрелмәгән дәрәҗәгә күтәрде. Бер атна элек, Маск DeepSeek R1 турында аңлатма биргәндә туры эфирда ышаныч белән әйтте, "xAI яхшырак AI моделен чыгарырга җыена". Тере рәвештә күрсәтелгән мәгълүматлардан күренгәнчә, Grok3 математика, фән һәм программалаштыру өчен барлык төп агым модельләрен узып киткән, һәм Маск хәтта Grok3нең SpaceX Марс миссиясе белән исәпләү эшендә кулланылачагын, "өч ел эчендә Нобель премиясе дәрәҗәсендәге уңышларны" алдан әйтә. Ләкин, хәзерге вакытта алар Маск сүзләре генә. Эшләтеп җибәргәннән соң, мин Grok3-ның соңгы бета версиясен сынап карадым һәм зур модельләр өчен классик хәйлә соравы бирдем: "Кайсы зуррак, 9.11 яки 9.9?" Кызганычка каршы, бернинди квалификация яки билгеләрсез, иң акыллы Grok3 дип аталган бу сорауга әле дә дөрес җавап бирә алмады. Grok3 сорауның мәгънәсен төгәл билгели алмады.

Бу сынау бик күп дусларның игътибарын җәлеп итте, һәм очраклы рәвештә, чит илләрдә булган шундый ук тестлар Grok3ның физика / математика сораулары белән көрәшкәнен күрсәтте: "Кайсы туп Пиза манарасыннан беренче төшә?" Шулай итеп, ул көлкечә "гади сорауларга җавап бирергә теләмәгән гений" дип язылган.

Grok3 яхшы, ләкин R1 яки o1-Proдан яхшырак түгел.

Grok3 практикада күп уртак белем тестларында "уңышсызлыклар" кичерде. XAI җибәрү вакыйгасы вакытында, Маск Grok3 кулланып, Exile Path 2 уенындагы персонаж классларын һәм эффектларын анализлау өчен күрсәтте, ул еш уйный дип әйтә, ләкин Grok3 биргән җавапларның күбесе дөрес булмаган. Тере агым вакытында маска бу ачык проблеманы сизмәде.

Бу хата чит ил кешеләре өчен Маскны уенда "алмаштыручы табу" өчен мыскыллау өчен өстәмә дәлилләр китереп кенә калмады, шулай ук Grok3 практик кушымталарда ышанычлылыгы турында зур борчылулар тудырды. Мондый "гений" өчен, аның мөмкинлекләренә карамастан, Марсның разведка биремнәре кебек бик катлаулы куллану сценарийларында аның ышанычлылыгы шик астында кала.

Хәзерге вакытта, Grok3 атна элек рөхсәт алган күп сынаучылар, һәм кичә берничә сәгать модель мөмкинлекләрен сынап караганнар барысы да уртак нәтиҗәгә киләләр: "Grok3 яхшы, ләкин бу R1 яки o1-Proдан яхшырак түгел."

"Нвидияне бозу" буенча критик перспектива

Чыгарылыш вакытында рәсми рәвештә тәкъдим ителгән PPTта, Grok3 Чатбот Аренада "алда" күрсәтелде, ләкин бу акыллы кулланылган график техника: лидер тактасындагы вертикаль күч 1400-1300 балл диапазонында гына күрсәтелде, тест нәтиҗәләренең оригиналь 1% аермасы бу презентациядә аеруча мөһим булып күренде.

Факттагы модель туплау нәтиҗәләрендә, Grok3 DeepSeek R1 һәм GPT-4.0дан 1-2% алда бара, бу практик сынауларда күп кулланучылар тәҗрибәсенә туры килә, "сизелерлек аерма юк". Grok3 аның варисларын 1% -2% ка арттыра.

Grok3 хәзерге вакытта ачыкланган барлык модельләрдән югарырак балл җыйса да, күпләр моңа җитди карамыйлар: xAI моңа кадәр Grok2 чорында "балл манипуляциясе" өчен тәнкыйтьләнде. Лидер тактасы җавап озынлыгы стилен җәзалаганлыктан, баллар бик кимеде, тармак инсайдерлары "югары балл, ләкин түбән сәләт" феноменын еш тәнкыйтьлиләр.

"Манипуляция" лидер тактасы яисә иллюстрацияләрдәге дизайн хәйләләре аша, алар xAI һәм Маскның модель мөмкинлекләрендә "пакетны алып бару" төшенчәсе белән обессиясен ачалар. Маск бу кырлар өчен бик югары бәя түләде: эшләтеп җибәрү вакытында ул 200,000 H100 GPU куллану белән мактанды (туры эфирда "100000 дән артык") һәм гомуми уку вакыты 200 миллион сәгатькә иреште. Бу кайберәүләргә бу GPU индустриясе өчен тагын бер мөһим уңыш дип саный һәм DeepSeek-ның бу тармакка йогынтысын "акылсыз" дип саный. Шунысы игътибарга лаек, кайберәүләр исәпләү көче модель тренингының киләчәге булыр дип саный.

Шулай да, кайбер торнистлар 2000 ай эчендә 2000 H800 GPU куллануны чагыштырдылар, DeepSeek V3 җитештерү өчен, Grok3-ның фактик укыту көче V3 белән чагыштырганда 263 тапкыр күбрәк. 1402 балл җыйган DeepSeek V3 белән Grok3 арасындагы аерма 100 баллдан түбән. Бу мәгълүматлар чыгарылганнан соң, күпләр тиз аңладылар: Grok3 титулы артында "дөньяның иң көчлесе" - ачык маргиналь файдалы эффект - көчлерәк җитештерүчәнлек китерүче зур модельләр логикасы кимүен күрсәтә башлады.

Хәтта "югары балл, ләкин түбән сәләт" белән, Grok2 куллануны хуплау өчен X (Twitter) платформасыннан бик күп сыйфатлы беренче як мәгълүматлары булган. Ләкин, Grok3 тренингында, xAI табигый рәвештә OpenAI алдында торган "түшәмгә" очрады - премиум укыту мәгълүматлары булмау модель мөмкинлекләренең маргиналь ярдәмен тиз фаш итә.

Grok3 һәм Musk уйлап табучылар, мөгаен, беренче булып бу фактларны тирәнтен аңлыйлар һәм ачыклыйлар, шуңа күрә Маск социаль челтәрләрдә гел кулланучылар кичергән версия "әле бета" һәм "тулы версия алдагы айларда чыгарылачак" дип искә төшерә. Маск Grok3 продукт менеджеры ролен үз өстенә алды, кулланучыларга аңлатмалар бүлегендә очрый торган төрле сораулар буенча җавап бирергә тәкъдим итте. Ул productирдә иң ияргән продукт менеджеры булырга мөмкин.

Шулай да, бер көн эчендә, Grok3-ның эшләве, һичшиксез, көчлерәк зур модельләр әзерләү өчен "массакүләм исәпләү мускулына" таянырга теләүчеләр өчен сигнализация тудырды: ачык булган Microsoft мәгълүматларына нигезләнеп, OpenAI-ның GPT-4 параметры 1,8 триллион параметр, GPT-3ныкыннан ун тапкыр күбрәк. Имеш-мимешләр буенча GPT-4.5 параметрлары тагын да зуррак булырга мөмкин.

Модель параметрлары зурайган саен, укыту чыгымнары да арта. Grok3 катнашуы белән, GPT-4.5 кебек көндәшләр һәм параметр зурлыгы аша яхшырак модель күрсәткечләренә ирешү өчен "акча яндыруны" дәвам итәргә теләүчеләр хәзерге вакытта ачык күренә торган түшәмне карарга һәм аны ничек җиңәргә икәнлеге турында уйларга тиеш. Бу мизгелдә, OpenAIның элеккеге баш галиме Илья Суцкевер, узган декабрьдә, "Без таныш булган әзерлек бетәчәк" дип әйткән иде, бу дискуссияләрдә яңадан башланды, зур модельләр әзерләү өчен чын юл эзләү.

Илья карашы тармакта сигнализация яңгыратты. Ул якынлашып килүче яңа мәгълүматларның бетүен төгәл алдан күрде, мәгълүматны алу аркасында эшне көчәйтеп булмый, аны казылма ягулык бетү белән чагыштыра. Ул "нефть кебек, интернетта кеше тудырган эчтәлек чикләнгән ресурс" диде. Сутскевер фаразлавында, киләсе буын модельләр, тренингтан соң, "чын автономия" һәм "кеше миенә охшаган" фикерләү мөмкинлекләренә ия булачак.

Бүгенге алдан әзерләнгән модельләрдән аермалы буларак, эчтәлеккә туры килүгә таянган (элек өйрәнелгән модель эчтәлегенә нигезләнеп), киләчәк ЯИ системалары кеше миенең "уйлануы" кебек проблемаларны чишү методикаларын өйрәнә һәм булдыра алачак. Кеше төп профессиональ әдәбият белән предметта төпле осталыкка ирешә ала, ә ЯИ зур моделе иң төп дәрәҗәдәге эффективлыкка ирешү өчен миллионлаган мәгълүмат пунктларын таләп итә. Сүз аз гына үзгәртелсә дә, бу төп сораулар дөрес аңлашылмаска мөмкин, бу модельнең интеллектта чынлап та яхшырмаганын күрсәтә: мәкалә башында искә алынган төп, ләкин чишелмәгән сораулар бу күренешнең ачык мисалы булып тора.

Йомгаклау

Ләкин, тупас көчтән тыш, Grok3 чыннан да тармакка "алдан әзерләнгән модельләр ахырына якынлаша" икәнлеген ачыклый алса, бу кыр өчен мөһим нәтиҗәләр китерәчәк.

Бәлкем, Grok3 тирәсендәге усаллык акрынлап басылганнан соң, без Фей-Фей Ли мисалын "билгеле бер мәгълүматлар базасында югары җитештерүчән модельләрне 50 долларга көйләү" мисалы кебек, AGI өчен чын юлны табарбыз.

ELV кабель чишелешен табыгыз

Контроль кабельләр

BMS, BUS, индустриаль, инструменты кабель өчен.

Монда басыгыз

Структуралаштырылган кабель системасы

Челтәр һәм мәгълүмат, җепсел-оптик кабель, пач шнуры, модульләр, бит

Монда басыгыз

2024 Күргәзмәләр һәм вакыйгаларга күзәтү

Пост вакыты: 19-2025 февраль

"Дөньядагы иң акыллы" Grok3 сынау

Кереш сүз

Grok3 яхшы, ләкин R1 яки o1-Proдан яхшырак түгел.

"Нвидияне бозу" буенча критик перспектива

Йомгаклау

Контроль кабельләр

Структуралаштырылган кабель системасы

16-18 апрель, 2024 Дубайда Якын Көнчыгыш-Энергия

16 апрель, 1824, 2024 Мәскәүдә Секурика

9 май, 2024 Я NEWА Продуктлар һәм Технологияләр Шанхайда ачыла

22-25-25 октябрь, Пекинда Куркынычсызлык Китай

1924 елның 20 ноябре