
文章来源: 更新时间:2025-02-19 09:01:34
我感觉马斯克的 Grok3 走错了方向,或者说,被 OpenAI 带沟里去了。
Grok3 有两个主要特点,第一个是大,10 万张 H100,算力远超其他模型,第二个是合成数据,Grok3 是第一个大规模***用合成数据而非人类数据的大模型。
这两点恰恰是 OpenAI 这两年所犯的最大错误,太信仰规模效应了,这也是被 DeepSeek 追上的主要原因。
模型越大,性能越强,这没错,但大到一定程度,边际效应就会递减。
GPT-3 拥有 1750 亿参数,比 GPT-2 多 10…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: