人工智能

Claude 5史诗级泄露 史上最强编程模型核心秘密曝光

字号+作者:新智元 来源:新智元 2026-02-03 16:20 评论(创建话题) 收藏成功收藏本文

Anthropic的新模型要来了!代号Fennec的ClaudeSonnet5马上要发布,性能吊打市面上所有编程大模型,价格还砍掉50%,还能比肩一整个人类开发团队,可以说达到编程'...

Anthropic的新模型要来了!代号Fennec的ClaudeSonnet5马上要发布,性能吊打市面上所有编程大模型,价格还砍掉50%,还能比肩一整个人类开发团队,可以说达到编程领域的巅峰。ClaudeSonnet5,马上就要发布了!euB品论天涯网

多条信息显示,ClaudeSonnet5(代号Fennec)已经存在于谷歌基础设施中,在性能上领先谷歌的「SnowBunny」整整一代。euB品论天涯网


euB品论天涯网

它有100万token上下文窗口,定价比Opus4.5便宜50%,将直接解决开发者对Opus「太慢、太贵」的核心不满。euB品论天涯网

而且,这次不是简单的模型升级,而是Anthropic直接把一个开发团队塞进了模型里。euB品论天涯网

在SWE-Bench上,它的成绩超过80.9%,远超当前目前市面上所有的编程大模型!euB品论天涯网

可以说,这个更便宜、更快、更强代码能力和多智能体开发模式的智能体,是ClaudeCode的关键解锁时刻。euB品论天涯网


euB品论天涯网

开端:一条「404错误日志」euB品论天涯网

事情的开端是这样的。euB品论天涯网

2月2日,有开发者在GoogleVertexAI调用API时,发现了一个神秘模型ID。euB品论天涯网

claude-sonnet-5@20260203

它的访问结果,是404NotFound。euB品论天涯网

懂的都懂,这就说明,模型现在已经在谷歌的基础设施中部署,只是还没给你用。euB品论天涯网

随后,知名AI博主PankajKumar直接下场确认——ClaudeSonnet5的代号是Fennec,已经在Google基础设施中了。euB品论天涯网

而发布时间,很可能就是2026年2月3日,最快明后天就会发布。euB品论天涯网

AI编程大战,已经是箭在弦上,一触即发!euB品论天涯网


euB品论天涯网

并且,现在已经有早期评测泄露出来。euB品论天涯网

测试者发现,在处理结构化视觉生成任务时,Sonnet5展现出了极强的性能,仅仅凭借「ASCII世界地图」的提示词,它就生成了测试者见过的最完整、最详细的结果!euB品论天涯网


euB品论天涯网

Sonnet5生成网站euB品论天涯网

此外,在UI渲染和复杂代码构建方面,Sonnet5也表现得游刃有余。euB品论天涯网


euB品论天涯网

Sonnet5玩游戏euB品论天涯网

Sonnet5,性能越级吊打Opus4.5euB品论天涯网

泄露信息显示,在多个内部基准测试中,ClaudeSonnet5的整体性能已经超越了ClaudeOpus4.5。euB品论天涯网

然而,它的定位却是Sonnet,而非Opus。也就是说,Anthropic在用中端的模型,干着旗舰的活。euB品论天涯网

而Sonnet5的编程能力也是一如既往的强。euB品论天涯网

内部测试数据显示,ClaudeSonnet5在SWE-Bench上的得分已经超过了80.9%。euB品论天涯网


euB品论天涯网

此前的SWE-Bench,最高分为74.4%euB品论天涯网

因此,它能独立完成大部分软件工程师日常会遇到的问题,比如修bug、重构、补测试、跑CI、找回归问题等等。euB品论天涯网

一句话,ClaudeSonnet5不只是在写代码,还是在交付代码!euB品论天涯网

同时,最让友商失眠的部分来了——它的推理成本显著下降,价格仅为ClaudeOpus4.5的50%!euB品论天涯网

原因很简单:Sonnet5,是直接在谷歌TPU上训练和优化的。别人还为H100抢破头的时候,Anthropic早已另辟蹊径。euB品论天涯网

除了价格上的优势上,Sonnet5的上下文还长达100万tokens,而且运行速度还有提升,还有更低的延迟。euB品论天涯网

从此,我们可以把整个项目代码库塞进去,它不是简单的「看文件」,而是理解全局再动手。euB品论天涯网

对于大项目、遗留系统、屎山代码来说,这简直是一项救命功能。euB品论天涯网

自动开发团队模型,上线!euB品论天涯网

真正恐怖的部分来了,Claude还进化出一种「自动开发团队」模型。euB品论天涯网

这种全新形态,被称为DevTeam。euB品论天涯网

在DevTeam模式下,Sonnet5能自动生成多个子智能体,然后并行协作完成开发。euB品论天涯网

只要给一句需求,多个子智能体会同时并行工作、互相校验。euB品论天涯网

最终输出的不是一段代码,而是一个完整可用、可测试、可迭代的功能模块。euB品论天涯网

可以说,这已经不是Copilot,而是一整个不请假的开发团队!euB品论天涯网

爆料:ClaudeCode「蜂群」模式来了euB品论天涯网

其实在前几天,就有关于ClaudeCode蜂群模式(AgentSwarm)的爆料。euB品论天涯网

可以猜测,这个蜂群模型跟传说中要上线的DevTeam有着极其密切的关系。euB品论天涯网


euB品论天涯网

爆料的关键人叫MikeKelly,他在X上爆了个猛料:ClaudeCode里,藏着一个尚未公开的Swarm功能。euB品论天涯网

euB品论天涯网

而且,他还放出了一个Fork项目——ClaudeSneakPeek,供大家试用。euB品论天涯网


euB品论天涯网

所谓Swarms,就是一个「总指挥」AI,加上一群随叫随到、即用即走的专业子智能体,构成一整套协作系统。这套模式如下——euB品论天涯网

Hierarchical(层级式):总指挥→组长→执行者euB品论天涯网

Dependency(依赖式):任务A完成,才能启动任务BeuB品论天涯网

Broadcast(广播式):一个信息,所有子agent同步接收euB品论天涯网

MessagingSystem(消息系统):agent之间可以互相通信euB品论天涯网

这样,所有AI就像公司一样运作了。euB品论天涯网


euB品论天涯网

其实,早在去年7月,Anthropic就推出了CustomSubAgents。然而它们有很多致命缺陷,比如记忆是碎片化的,要靠人手动补丁,而且创建子Agent也是全靠人。euB品论天涯网

然而这次的「蜂群」就不一样了!euB品论天涯网

一位开发者的实测任务开始:让AI为工具创建一个Web前端,允许你在终端中从X上下载视频。euB品论天涯网

让Claude读取一个plan.md,要求它拆分任务,用Swarm的方式执行。euB品论天涯网

惊人的一幕来了:一开始,没有任何自定义子agent。euB品论天涯网

执行任务后,奇迹发生了!Claude自动创建了TeamLeader、Front-endBuilder、BackendBuilder、ComponentBuilder和QATester。euB品论天涯网


euB品论天涯网

这些Agent全部在并行工作,状态实时可见。甚至,你可以进入任意Agent,查看它的systemprompt,来看看它们脑子里正在想什么。euB品论天涯网


euB品论天涯网

最夸张的地方是,Agent还会「自己生孩子」。任务进行到一半,Claude发现还不够,于是又生成了PIServerAgent、前端构建Agent、CSS专项Agent、API集成Agent等等。euB品论天涯网

Agent数量直接膨胀到8个,而且全程无人干预!可以说,这已经不是多智能体,而是AI在自我组织。euB品论天涯网


euB品论天涯网

任务结束后,Claude还输出了项目总结和执行报告的两份文件,这已经是工程管理级别的产出了。euB品论天涯网


euB品论天涯网

不过,为什么如此强大的蜂群功能还没开放呢?原因在于,这个能读取你全部上下文的超级调度器,功能太危险,不能轻易放出来。euB品论天涯网

可以想象的是,如果Swarm真正开放,ClaudeCode将不再仅仅是写代码的AI,而是能自己组建研发团队的系统。euB品论天涯网

这,将是一个彻底的范式升级。euB品论天涯网

时间点的杀意:正面硬刚OpenAIeuB品论天涯网

就在这几天,OpenAI的同期动作一直很猛。奥特曼已经预告了接下来是Codex全家桶的发布月。euB品论天涯网

Anthropic选择这个时间点发布Sonnet5,用意很明显:来,正面硬刚!euB品论天涯网

而之所以能有这个底气,答案就是一个字——钱。euB品论天涯网

在2026年1月底,Anthropic已经完成了超过100亿美元的融资,估值达3500亿美元,而最终的融资规模可能达到200亿。euB品论天涯网

根据MenloVentures在2025Q4的报道,Anthropic的企业市场占有率已经占到了40%,远远领先于OpenAI的27%和谷歌的21%。euB品论天涯网

而且仅仅半年,ClaudeCode的年化收入就破了10亿美元。euB品论天涯网

最近,Anthropic已经凭Cowork直接引爆了一连串编程奇点,甚至孵化了Clawdbot和Molbook这样新物种的诞生。euB品论天涯网

如果这次泄露属实,那么ClaudeSonnet5(Fennec)将成为第一个真正意义上「能像团队一样工作的模型」。euB品论天涯网

2026年2月3日,很可能会被记为软件工程的分水岭之一。euB品论天涯网

参考资料:euB品论天涯网

https://x.com/RichOBray/status/2018351965323850149euB品论天涯网

https://x.com/pankajkumar_dev/status/1753448405523136512euB品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]