Grok是xAI用以对标OpenAI的ChatGPT和GoogleGemini等模型的产品,能够分析图像并回答问题。
外界对Grok4的期望很高。xAI这款最新的AI模型将直接对垒OpenAI即将推出的GPT-5,后者预计将在今年夏末发布。
“对于学术问题,Grok4在每个学科上都超过了博士水平,无一例外,”埃隆·马斯克在直播中说道。“它有时可能缺乏常识,也尚未发明新技术或发现新物理学,但这只是时间问题。”
xAI于周三发布了两款模型:Grok4和Grok4Heavy——后者是该公司的“多智能体版本”,性能更强。
Grok4特性如下:
先进的推理能力: Grok4在xAI的Colossus超级计算机上进行了训练,以实现科学家级别的先进推理。该模型有望提供更强的逻辑推理和文本生成能力。
专注于编码的变体: 开发者将会青睐Grok4Code,这是一个专门用于更高效地编写、调试和解释代码的特化模型,与GitHubCopilot或GPT-4CodeInterpreter等工具相呼应。
多模态能力: Grok4预计将不仅支持文本,还支持图像,并可能支持视频。更好的多模态能力将使该模型能与OpenAI的GPT-5o和Google的Gemini2.5Pro展开更激烈的竞争。Grok4未来某个时候可能会支持视频。
语音功能: Grok4的语音功能(Grok4Voice)拥有自然、酷似真人的声音,且干扰更少。
实时网络访问:与早期的Grok模型一样,Grok4配备了DeepSearch工具,可以从网络、尤其是马斯克的X平台实时抓取数据。这意味着Grok可以在聊天过程中提供最新信息——无需打开独立的标签页或浏览器。
文化通晓与“玩梗”能力: Grok最大的差异化优势之一是它对互联网文化的理解。Grok4正在被调校以高精度解读“梗”、俚语和幽默,这可能使其成为迄今为止最“懂网上冲浪”的AI助手之一。
xAI声称,Grok4在多项基准测试中展现了前沿水准,其中包括“人类最后一道考题”(Humanity’sLastExam),这个考试通过数千个关于数学、人文学科和自然科学等主题的众包问题,来衡量AI的能力。据xAI称,Grok4在不使用“工具”的情况下,在该测试中得分率为25.4%,超过了GoogleGemini2.5Pro的21.6%,以及OpenAI的o3(high)的21%。
xAI还声称,配备“工具”的Grok4Heavy取得了44.4%的高分,超过了同样使用工具、得分为26.9%的Gemini2.5Pro。
此外,非营利组织ArcPrize表示,Grok在他们的ARC-AGI-2测试中取得了新的SOTA(State-of-the-Art,即当前最佳水平)分数——这是另一个高难度基准,由类似拼图的难题组成,需要AI识别视觉模式——得分率为16.2%。这几乎是排名第二的商业AI模型ClaudeOpus4得分的两倍。
除了Grok4和Grok4Heavy,xAI还推出了其迄今最昂贵的AI订阅计划、名为SuperGrokHeavy的每月300美元的订阅服务。该计划的订阅者将能抢先体验Grok4Heavy,并优先使用新功能。此计划与其他主要AI提供商如OpenAI、Google和Anthropic推出的超高端会员服务类似,但xAI目前提供了其中最昂贵的订阅选项。
SuperGrokHeavy的订阅者或许能提前体验到xAI计划在未来数月推出的一些新产品。该公司周三表示,一款AI编码模型将于8月问世,一个多模态智能体将于9月推出,而视频生成模型则定于10月。
xAI正通过其API发布Grok4,以吸引开发者基于该模型构建应用。该公司提到,其企业业务部门成立仅两个月,但计划与各大超大规模云服务商合作,通过他们的云平台提供Grok。
尽管Grok在基准测试中表现出了领先水平,但当xAI试图将Grok作为ChatGPT、Claude和Gemini的真正竞争者向企业推销时,它可能很难摆脱近期的这些负面事件。企业是否准备好连同其所有缺陷一并接纳Grok,仍有待观察。
Grok4的发布,恰逢马斯克旗下公司经历动荡的一周。周三早些时候,在X公司任职约两年后,其首席执行官琳达·亚卡里诺(LindaYaccarino)宣布辞职。目前,X尚未公布她的继任者。
巧合的是,雅卡里诺的离职,发生于几天前Grok的官方自动化X账号曝出丑闻之后:该账号在回复用户时发表了攻击性帖子。xAI不得不短暂限制该Grok账号,并删除了这些内容。
马斯克和xAI的领导层基本上回避了对此事件的讨论,而是将焦点放在了Grok4的性能和能力上。
相关文章:
马斯克发布Grok4大模型叫板GPT-5首席科学家却临阵离职

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】