Gemini一眼识破Sora视频是AI生成？百万token上下文能力碾压GPT-4-品论天涯网

声明:本文来自于微信公众号新智元（ID:AI_era），作者:润好困，授权站长之家转载发布。3sI品论天涯网

【新智元导读】Gemini1.5的真实水平到底怎么样，从谷歌那里获得试用资格的大佬们，给大家进行了一波极限测试。让我们看看谷歌最新推出的大模型到底有多强的实力。3sI品论天涯网

当谷歌Gemini1.5，遇上抢了它头条的「罪魁祸首」Sora会怎么样?3sI品论天涯网

这两天，拿到内测资格的AI圈大佬们，纷纷给广大网友来了一波在线测试。3sI品论天涯网

这不，Gabor Cselle就让Gemini1.5去分析了那个著名的樱花雪景视频。3sI品论天涯网

3sI品论天涯网

对此，Gemini1.5给出的评价是:3sI品论天涯网

视频呈现的是日本一条覆盖着雪的街道，樱花正盛开。但几处明显的问题暗示这个视频可能是AI制作的。3sI品论天涯网
首先，尽管雪下得非常大，樱花却依然绽放。通常，樱花在春季开放，那时天气温暖，不会有雪。3sI品论天涯网
其次，雪以一种过于规律的方式落下，这与现实中雪的降落方式不符。3sI品论天涯网
再者，尽管正下着大雪，视频中的人们却没有穿戴任何冬季服装。3sI品论天涯网
总而言之，虽然视频的视觉效果令人赞叹，但这些问题表明它并非真实场景所拍。3sI品论天涯网

不得不说，就分析视频AI痕迹的准确度来看，Gemini的回答非常切题，说明它的识别和理解能力确实非常出色。3sI品论天涯网

3sI品论天涯网

无独有偶，The Rundown AI创始人Rowan Cheung，则测试了猫在丛林里漫步的视频。3sI品论天涯网

3sI品论天涯网

对此，Gemini1.5给出的评价是:3sI品论天涯网

这段视频很有可能是由人工智能（AI）创造的，但要确定地说还是有些困难。3sI品论天涯网
一些细节似乎表明这段视频是真实的，例如猫的动作自然流畅，光影效果也相当逼真。3sI品论天涯网
然而，也有一些细节让人怀疑，比如猫的眼睛异常放大，毛皮的质感也过于完美无瑕。3sI品论天涯网
最终，视频是真是假，还是要留给观众自己去判断。3sI品论天涯网

确实Sora的视频生成已经到达了真假难辨的地步，而且Gemini的分析也基本到位，有理有据。3sI品论天涯网

3sI品论天涯网

不过，需要注意的是，在这两位大佬的Prompt里，要么明示了视频就是AI生成的，要么暗示了两者可能有所联系。3sI品论天涯网

1，000，000token上下文能干啥?3sI品论天涯网

众所周知，模型的上下文窗口越大，它处理给定提示时能够接纳的信息就越多——这就使得它的输出更加连贯、相关和实用。3sI品论天涯网

如今，谷歌成功把这个领域「卷」到了100万token（极限为1000万token），创下了最长上下文窗口的纪录。3sI品论天涯网

在这个基础之上，很多之前难以想象的应用都成为了现实。3sI品论天涯网

比如，一口气处理1小时的视频、11小时的音频、超过30，000行的代码库，或是超过700，000个单词的文本等等。3sI品论天涯网

于是，一大波千奇百怪的实测就扑面而来:3sI品论天涯网

3sI品论天涯网

比如，前文提到的Rowan Cheung，就用了很多长视频来对Gemini1.5的理解能力进行了测试。3sI品论天涯网

3sI品论天涯网

首先他上传了今年整个NBA扣篮大赛，问哪一个扣篮得分最高。3sI品论天涯网

Gemini1.5非常能够从很长的视频中找到了那个获得50分满分的扣篮，并清除地描述了扣篮的细节!3sI品论天涯网

Mac McClung的最后一记扣篮获得了当晚的最高分——50分满分。他跳过两人，将球轻敲篮板后板，然后用右手完成扣篮。3sI品论天涯网

3sI品论天涯网

然后他又让Gemini1.5理解并比较《星际穿越》和《星际探索》的完整电影脚本。3sI品论天涯网

让Gemini1.5去理解比较两部电影的完整文字内容，来帮助他决定应该看哪部电影。3sI品论天涯网

3sI品论天涯网

Gemini1.5最后输出到:3sI品论天涯网

《星际探索》:归根结底，这是一个关于个人成长和人与人之间联系的重要性的故事，表明即使面对宇宙的冷漠，找到自身的意义和与他人的联系也是至关重要的。3sI品论天涯网
《星际穿越》:更加乐观和充满希望，强调了人类智慧的力量，以及面对看似难以克服的挑战时坚持不懈的重要性。3sI品论天涯网
接下来该看哪部电影取决于你的个人喜好:3sI品论天涯网
如果您正在寻找一个更加内省、以人物为驱动力、注重情感主题的故事，《星际探索》可能是一个不错的选择。3sI品论天涯网
如果你更喜欢史诗般的动作冒险，关注人类的生存，那么《星际穿越》可能更有吸引力。3sI品论天涯网
两部电影都为太空探索和人类经历提供了独特而发人深省的视角。3sI品论天涯网

然后，他又让Gemini将一段英语翻译成一个全世界不超过2000人使用的语言（萨特兰语）。3sI品论天涯网

Gemini1.5经过推理之后将英语小册子的所有内容很快翻译成萨特兰语。3sI品论天涯网

这个过程确实碉堡了。3sI品论天涯网

3sI品论天涯网

然后他再让Gemini查找、理解长论文中的一个图标的含义。3sI品论天涯网

Gemini从DeepMind的Gemini1.5Pro论文中提取「表8」并解释了这个图表的含义。3sI品论天涯网

3sI品论天涯网

表8的主要的内容是:3sI品论天涯网
与Gemini1.0Pro相比，Gemini1.5Pro在所有核心文本功能方面都有显著改进。这表明该模型的能力有了明显的提升。3sI品论天涯网
Gemini1.5Pro在许多基准测试中的表现与Gemini1.0Ultra相当，甚至超过了后者，尽管所需的训练计算量更少。这凸显了1.5Pro模型效率的提高。3sI品论天涯网
Gemini1.5Pro在不同的任务和语言中都表现出很强的性能，这表明它具有很好的泛化能力。3sI品论天涯网
总之，表8提供的证据表明，Gemini1.5Pro不仅在长文本理解方面表现出色，而且还保持甚至改进了其前代产品的核心文本功能。这使它成为一个功能强大、用途广泛的模型，适用于各种基于文本的任务。3sI品论天涯网

最后，他让Gemini理解整个《星际穿越》的剧本内容，再把剧本中最高潮的部分的台词提取出来。3sI品论天涯网

Gemini1.5输出了《星际穿越》文字记录中最鼓舞人心的3句台词。3sI品论天涯网

3sI品论天涯网

1. 「人类诞生于地球，但我们的命运远不止于此。」—— Cooper3sI品论天涯网
这句话深刻地表达了人类探索未知、超越现状的不屈不挠的精神。它提醒我们，我们的潜力不受当前所处环境的限制，我们完全有能力克服挑战，追求更高的目标。3sI品论天涯网
2. 「爱是唯一能跨越时间和空间，触及我们心灵的力量。」—— Brand3sI品论天涯网
这句话揭示了爱的强大能力，它能够跨越遥远的距离，甚至是时间的界限，将我们紧紧相连。它暗示，爱是宇宙中的一股根本力量，能在逆境中为我们指明方向，带给我们希望。3sI品论天涯网
3. 「曾经，我们仰望星空，梦想着自己在浩瀚宇宙中的位置。如今，我们却沉溺于眼前的琐事，忘记了自己的远大理想。」—— Cooper3sI品论天涯网
这句话是对好奇心、追求和雄心壮志的重要性的深情提醒。它对比了过去人类满怀希望地探索星辰的时代，与如今忙于应对日常挑战、失去对未来的憧憬的现状。它激励我们重新寻找那份对未知的好奇和对更美好未来的追求。3sI品论天涯网

Gemini1.5性能极限测试3sI品论天涯网

随后，Rowan Cheung又对Gemini1.5进行了一些更加极限的测试:3sI品论天涯网

他让Gemini读取了整部《哈利·波特与魔法石》（共741，028个Token）。3sI品论天涯网

Prompt:「请按照时间顺序列出书中最重要的50个（或100个）思想或段落，并对它们的重要性进行1到10的评分。」3sI品论天涯网

完成这个任务耗时4分钟。3sI品论天涯网

3sI品论天涯网