
文章来源: 更新时间:2025-03-14 16:00:08
还是比较期待 Zero 路线, 虽然现在看来 R1 路线商业化更成功 现阶段纯 RL 版 DeepSeek Zero 不成功的主要原因是不说人话, 也解决不了太难的问题 与之相比能说人话、讲思路的 DeepSeek R1 真是太善解人意了. 不过就像完全脱离人类棋谱的 AlphaGo Zero 可以吊打 AlphaGo 一样 完全脱离人类语言的纯粹 RL 版本在未来一定是更为强大的 RL 造出来的神, 强行要求说人话, 这是一种失格, 价值反而降低了. 世界上有很多问题是验证远比求解…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: