今年中国开源大模型密集迭代:自1月的DeepSeek/R1起步,随后阿里Qwen以及Moonshot、Z.ai、MiniMax等接连发布。上述模型普遍提供可免费下载与改动的开源/开权重版本,推动了全球开源模型的发展。美国方面,长期坚持闭源策略的厂商感到压力,OpenAI已在8月推出首个开源模型gpt-oss作为回应。
科技史表明,标准之争并非总由“技术最强”决定,可得性与灵活性常是关键。这也是为何中国在开源AI上的推进引发美国政企侧的关注。7月发布的美国AI行动计划也提出:开源模型有望在部分业务与学术场景成为全球标准,并呼吁美国国内打造所谓“基于美国价值观的开源模型”。
在商业模式上,开源赢家短期直接回报有限,但可像Android/Linux生态那样,通过免费部分带动配套服务(应用、云与工具链)变现。研究共同体长期拥抱开源以加速前沿技术演进;中国亦鼓励在AI、操作系统、半导体架构、工程软件等领域开展开源研发。
企业侧采纳正在扩大。新加坡华侨银行(OCBC)基于开源模型自研约30个内部工具:用Gemma做文档摘要、Qwen辅助写代码、DeepSeek做行情分析;其策略是避免被单一模型锁定、随时根据新版本切换,并偏好多数开发者熟悉、便于获得技术支持的模型。
性能体验方面,第三方评测机构ArtificialAnalysis指出:自去年11月起,在权威评测的综合分里,中国公开权重的大模型总体跑分比当前美国最强的开源模型更高;其一项对比中,Qwen3的版本优于gpt-oss。多位亚洲工程师也反馈,中文与区域文化语境下,部分中方模型对隐含意图与礼貌表达把握更好。日本横滨工程师ShinichiUsami为零售客户搭建客服机器人时,因对细腻表达理解更佳而选择Qwen。
产业竞争正从闭源价格战延伸到开源生态的用户争夺。研究人士称,中国公司往往优先做大用户黏性,再以配套服务承接商业化。窗口期内,初创有机会迅速积累用户,但大型平台更具变现能力。硅谷初创公司DeepLearning.AI负责人吴恩达在一篇近期的博客中认为,激烈竞争将淘汰一批玩家,但也会锤炼出更强的公司。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】