
文章来源: 更新时间:2025-02-01 11:40:07
这不奇怪,蒸馏技术在大模型领域应用得很广泛了,只是这次 DeepSeek 影响比较大,被针对了。
Distillation Quantification for Large Language Models(大型语言模型的蒸馏量化)这篇论文测试了一系列主流模型的蒸馏程度,结果如下: ICE 结果显示,GLM4-Plus、Qwen-Max-0919 和 DeepSeek-V3 是疑似响应数量最多的三个 LLM,说明其蒸馏程度较高。
相反,Claude-3.5-Sonnet 和 Doubao-Pro-32k 几乎没有出现可疑响应,说明这几个 LL…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: