这个春节全网都在等DeepSeek发布最新的大模型DeepSeekV4,但是现在来看大版本不一定会在春节期间发布,今天DeepSeek悄然更新了新版本,亮点不少。根据DeepSeek自己的介绍,这次更新主要是提升了上下文能力,达到了1M,而之前的DeepSeeV3系列也就是128K。
有了1M上下文,DeepSeek可以一次性处理《三体》三部曲这样体量的超长文本,这点已经得到了很多网友的实测证实。
其他方面的能力是之前就有的,DeepSeek也没有提及更详细的信息。
值得注意的是,DeepSeek在回答完这个问题之后还特别加了一段,强调它就是最新的DeepSeek模型,没有特定的子名称,不是V3也不是R1,彷佛在刻意强调这个模型的不同,但又不让人产生这就是V4Preview预览版的联想。
但是从网友的反馈来看,这次DeepSeek的小更新实际上能力提升很大,知名大模型测试博主@karminski-牙医已经发布了一个快速测试,主要测试了编程方面的一个大象牙膏的测试项目。
结论就是肉眼可见美学,建模,物理模拟,代码性能都有提升,甚至还有小惊喜,这个就是比之前发布的任何版本都SOTA,也就是当前最优的大模型(当然主要是指DS的版本)。
目前还不确定DeepSeek的这个新模型是不是完全体,因为有网友测试这两天很热门的50米距离上去洗车是走路还是开车去的问题上,DeepSeek新模型给出的回答不一,有人说正确,有人说不行。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】