
文章来源: 更新时间:2025-01-02 14:50:10
我不知道这些benchmark都是怎么跑出来的,我测评了三个比较真实的问题,感觉要和cluade 3.5 Sonnet和GPT4-o正面竞争,在不考虑价格的情况下, 单论回答的质量还是明显不如的 第一个问题来源于今天逛知乎看到的 为什么***经济下科技创新能力低下? 为了写这个答案我需要查询苏联获得诺贝尔奖的情况,我把这个问题交给Cluade 3.5 Sonnet和deepseek v3,以下是各自的回答 首先正确答案是一共有四个项目,分别在四个不同年份获奖,分…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: