
文章来源: 更新时间:2025-02-07 12:50:07
这里要给大家先说几点,避免其他文章被带入到误区。
s1超过的是o1-preview,没有超过o1甚至o1-mini,有很大区别s1的效果不敌deepseek-r1 800k数据蒸馏的32B模型,差了不少,不是媲美s1即使使用全量59k数据的效果也没有提高很多,甚至在math上还有下降,所以核心是数据质量1k数据是从59K数据中筛选出来的,不是直接有1K数据就可以s1使用1k数据是节省了训练时间,但蒸馏的难点在蒸馏数据的构造上好了,下面开始介绍s1。
蝉1的本质是…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: