申请报道在线投稿

人工智能

OpenAI神秘gpt2正在A/B测试，奥特曼抢先剧透，网友已玩嗨

字号+作者：来源：量子位公众号 2024-05-08 16:00 评论(创建话题) 收藏成功收藏本文

声明:本文来自微信公众号“量子位”（ID:QbitAI），作者:明敏，授权站长之家转载发布OpenAI正在秘密A/B测试下一代模型，实力超强被怀疑是GPT-4.5或GPT-5。就在奥'...

声明:本文来自微信公众号“量子位”（ID:QbitAI），作者:明敏，授权站长之家转载发布OwB品论天涯网

OpenAI正在秘密A/B测试下一代模型，实力超强被怀疑是GPT-4.5或GPT-5。OwB品论天涯网

就在奥特曼当谜语人暗示之后，两款新模型悄悄上线大模型竞技场。OwB品论天涯网

OwB品论天涯网

Im-a-good-gpt2-chatbotOwB品论天涯网

Im-also-a-good-gpt2-chatbotOwB品论天涯网

和GPT-4-Turbo（左）同场竞技，gpt2-chatbot(右)明显更胜一筹。OwB品论天涯网

提示词:画一个自由女神像。OwB品论天涯网

OwB品论天涯网

此前一款名为gpt2-chatbot的超强模型仅仅上线一天，热情的网友就把服务器挤爆了，不得不下架，大家纷纷表示还没玩过。OwB品论天涯网

这次重新上线后，模型在一次报错中直接给出了跳转OpenAI平台网站的链接。OwB品论天涯网

OwB品论天涯网

这下大家都嗨了，做实了是OpenAI在搞A/B测试?OwB品论天涯网

OwB品论天涯网

还有人表示，这俩模型可能已经在推理和计划方面进行微调。OwB品论天涯网

OwB品论天涯网

现在在竞技场里随机匹配，就能遇到这俩新模型。OwB品论天涯网

这不，网友们已经纷纷前去测试，一探它们的底细了。OwB品论天涯网

代码能力突出

和第一次露面有所不同，如今想要用上gpt2，只能在Arena（battle）里碰运气，Direct Chat中找不到它们的影子。OwB品论天涯网

有的人运气好，试了5次就成功让这俩模型battle了一局。OwB品论天涯网

OwB品论天涯网

结合几个示例来看，im-also-a-good-gpt2-chatbot生成的回答似乎总是更简洁一些。OwB品论天涯网

OwB品论天涯网

代码生成方面，它能一次生成一个可执行的游戏代码。OwB品论天涯网

提示词:Code Flappy Bird game in PythonOwB品论天涯网

效果如下:OwB品论天涯网

OwB品论天涯网

如果回答的代码有误，可以进一步追问让它自己改正。OwB品论天涯网

比如让它们写一个康威生命游戏的代码，在未告知使用Colab时，模型写出的代码有问题。OwB品论天涯网

但继续追问并表示自己用的是Colab，im-also-a-good-gpt2-chatbot能够自己修改对代码，im-a-good-gpt2-chatbot不行。OwB品论天涯网

OwB品论天涯网

还有在解决物理题方面，有Reddit用户说im-also-a-good-gpt2-chatbot能解答出其他模型都答不对的物理题。OwB品论天涯网

问题:绿灯侠从一栋高楼楼顶跳下，他从静止状态开始做自由落体运动到地面，在他下落过程的最后1秒时，距离地面的距离是大楼一半的高度，这座楼有多高?OwB品论天涯网

OwB品论天涯网

不过我们实测了下，im-a-good-gpt2-chatbot似乎也能做对。OwB品论天涯网

OwB品论天涯网

还有人测试了一道推理题目，im-a-good-gpt2-chatbot可回答正确，im-also-a-good-gpt2-chatbot也能做到但需要两次提示。OwB品论天涯网

问题:现在有两个足球队。球队A赢了8次，球队B赢了5次，已知还剩7次比赛，球队B想要赢得整场比赛，还需要至少赢几次?OwB品论天涯网

OwB品论天涯网

网友:白嫖大家反馈吗?

尽管OpenAI还是没有正式认领gpt2-chatbot，但网友几乎已经默认它们是一家了。OwB品论天涯网

因此有人觉得，gpt2-chatbot在竞技场上搞A/B测试，这不是让大家免费给他当志愿者。OwB品论天涯网

OwB品论天涯网

OpenAI想要对内部模型进行人工评估，应该付给测试人员报酬，而不是在免费社区做。OwB品论天涯网

OwB品论天涯网

有人觉得他们这么做，就是为了炒热度。OwB品论天涯网

OwB品论天涯网

但现在gpt2-chatbot的底层模型到底是啥还不确定。OwB品论天涯网

有人直接问了gpt2-chatbot，但可能存在幻觉，它表示自己基于GPT-4架构，是GPT-4.5的变体。OwB品论天涯网

但之前奥特曼在公开演讲中已经否定了。测试网友表示自己没有给出过GPT-4.5相关的提示内容。OwB品论天涯网

OwB品论天涯网

也有人怀疑，这两个模型大小不一样，叫这个名字是不是因为采用了GPT-2的架构来训练模型。OwB品论天涯网

这和单纯的MoE不同，它们使用了Q*、合成数据，Sam的推特编辑历史是不是暗示了这一点?OwB品论天涯网

OwB品论天涯网

值得一提的是，最近有大V爆料称本周OpenAI将公布进军搜索引擎的消息。OwB品论天涯网

OwB品论天涯网

OpenAI已经更新了网站主页，第一个轮番页是一个搜索框上面写着“向ChatGPT问任何事情”OwB品论天涯网

OwB品论天涯网

爆料说这次发布的时间可能在北京时间周五的凌晨2点。OwB品论天涯网

总之，最近OpenAI的动向，都有点神秘。OwB品论天涯网

参考链接:OwB品论天涯网

[1]https://twitter.com/itsandrewgao/status/1787758687651811705OwB品论天涯网

[2]https://twitter.com/DimitrisPapail/status/1787899811514982887OwB品论天涯网

[3]https://twitter.com/AlphaSignalAI/status/1786025388902097077OwB品论天涯网

[4]https://gizmodo.com/powerful-new-gpt2-chatbot-mysteriously-returns-1851460717OwB品论天涯网

OpenAI

本网除标明“PLTYW原创”的文章外，其它文章均为转载或者爬虫(PBot)抓取；本文只代表作者个人观点，不代表本站观点，仅供大家学习参考。本网站属非谋利性质，旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的，可来信联系本站删除。本站邮箱[email protected]

相关文章

【查看完整讨论话题】 | 【用户登录】 | 【用户注册】

头条焦点

刘敬东：马克思考察货币转化为资本的历史意识与阶级意识

李乾坤：金融资本主义的兴起与西方马克思主义的终结

赵丁琪：全球南方的崛起与中国角色

王喆：毛泽东关于抗日战争战略相持阶段的重要论断

赵丁琪：技术封建主义：内涵、争议与应对

精彩导读

关注我们

关注微信公众号，了解最新精彩内容