
文章来源: 更新时间:2025-01-30 08:30:07
说"蒸馏"太难听了,感觉是把翱辫别苍础滨的模型,整个榨了一边,但这不是事实。
就是借鉴了一些输出风格,学了一些用户对齐,中国在这方面做得的确不好,主要是DeepSeek V3。
DeepSeek R1主要靠强化学习+RLHF,从风格上来看,R1和OpenAI的模型相差就比较大了,包括英语,R1的思维非常活跃奔放——从最终模型表现可以看出来,V3和R1用的不是同一套对齐方式。
OpenAI是给输出风格上"专利"了吗?OpenAI是否对输出内容享有真实的"版权"? Op…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: