
文章来源: 更新时间:2025-01-28 21:40:07
听说国内又开始“且听龙吟” “提头来见” 又开始炒作这个叫DeepSeek的“AI奇迹”?一看技术报告我就笑了——用FP8精度训练MoE架构省成本,这不就是把大排档的炒饭技术包装成米其林三星吗?OpenAI用FP16是为了保证数值稳定性,DeepSeek强行上FP8,表面看是“算法优化”,实则像用算盘解微积分,哪天梯度爆炸连代码都找不到北。
至于那个“训练成本仅550万美元”的噱头,硅谷工程师随便喝杯咖啡的时间就能戳穿:你们用贬800显卡囤货…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: