一图看懂DeepSeek V4与美国顶级AI差距：落后8个月-品论天涯网

快科技5月3日消息，4月24日DeepSeekV4系列大模型正式发布，距离去年的DeepSeekR1更新过去了15个月了，V4的性能到底如何也引发了国内外的讨论，美国人也非常关心。U8b品论天涯网

评估DeepSeekV4的能力已经有很多测试了，美国外交关系委员会组织了3个高级研究员之前的研究报告显示其落后美国顶级大模型大约7个月。U8b品论天涯网

现在美国国家标准与技术研究院（NIST）下属人工智能标准与创新中心（CAISI）也来评估DeepSeekV4，他们的结论是DeepSeekV4落后美国大约8个月，跟前面的差距差不多。U8b品论天涯网

U8b品论天涯网

在他们的AI能力评估结果中，DeepSeekV4得分在800分，而当前最强的是GPT-5.5，分数超过1200分，GPT-5.4及Opus4.6也在1000分以上。U8b品论天涯网

DeepSeekV4整体性能跟8个月前的GPT-5差不多，但DeepSeek官方之前在发布报告中认为跟GPT-5.4差不多。U8b品论天涯网

不过CAISI也承认DeepSeekV4是他们评测过的中国最强AI大模型，在网络、软件工程、自然科学、抽象推理和数学这五个领域中九项测试都很强。U8b品论天涯网

U8b品论天涯网

更重要的是，DeepSeekV4的性价比更强，即便与美国最有成本优势的GPT-5.4mini大模型相比，DeepSeekV4在7个基准测试中有4个测试成本更优，高出41%到53%不等。U8b品论天涯网

U8b品论天涯网