人工智能

ChatGPT官方鉴别器紧急发布:当代自相矛盾 不想却遭遇群嘲

字号+作者: 来源:量子位 2023-02-01 17:15 评论(创建话题) 收藏成功收藏本文

ChatGPT到处“造假”作弊,现在搞得OpenAI官方都坐不住了。就在今天,OpenAI紧急发布官方打假工具:基于GPT打造,打开网页就能用。好家伙,这岂不是真·以己之矛'...

ChatGPT到处“造假”作弊,现在搞得OpenAI官方都坐不住了。就在今天,OpenAI紧急发布官方打假工具:基于GPT打造,打开网页就能用。好家伙,这岂不是真·以己之矛攻己之盾了?一经上线,那叫一个火爆,不少网友第一时间就冲过去测试了。jfM品论天涯网


jfM品论天涯网

然鹅,网友们一番试验之下却发现——jfM品论天涯网

这官方工具,跟咱自己瞎猜效果也差不多啊???jfM品论天涯网

官方出品,约等于瞎猜jfM品论天涯网

有人给OpenAI这个新鉴别器投喂了一小段文字,结果首次尝试就翻车了。jfM品论天涯网


jfM品论天涯网

这位网友首先让AI写下一段文字,内容是评价莎士比亚的一个历史剧角色,不过他向写作AI特意给了个提示:jfM品论天涯网

请以人类的方式来写,争取逃过AI鉴别工具的火眼金睛。jfM品论天涯网

结果没想到,还真就骗过了官方鉴别器。它看完给出回复:这“非常不可能是AI生成的”。jfM品论天涯网

这个官方工具对文本内容的判定结果一共就5个等级:jfM品论天涯网

非常不可能是AI生成的jfM品论天涯网

不太可能是AI生成的jfM品论天涯网

不清楚是不是AI生成的jfM品论天涯网

可能是AI生成的jfM品论天涯网

很可能是AI生成的jfM品论天涯网

好家伙,这不是和真实情况完全相反嘛,让网友都蚌埠住了:真是因吹斯汀…jfM品论天涯网


jfM品论天涯网

还有人把ChatGPT生成的内容一字不改,直接拿给鉴定AI看。但鉴定AI依然懵圈儿:“不清楚是不是AI生成的”。jfM品论天涯网


jfM品论天涯网

这位网友也只好呵呵,并指出:jfM品论天涯网

实际上,大家用ChatGPT等AI生成文字后,并不会原封不动地直接用,一般还会手动修改一下,或者丢进quillbot.com等润色工具里加工,很可能导致鉴定AI更摸不着头脑。jfM品论天涯网

好吧,既然AI生成文字分不太清,那人类写的东西能认出来吗?jfM品论天涯网

有人把自己之前在HackerNews上发表的大段评论(纯手打)喂给了鉴定AI,结果10次中有9次,AI都反馈说“不清楚是不是AI生成的”。jfM品论天涯网

在网友们的一片吐槽声中,量子位也忍不住亲测了一下这个AI到底行不行。jfM品论天涯网

首先,我们先给它看了段真人写的文字,内容是一位华盛顿大学博士对TensorCore的讲解,这次AI并没有失误。jfM品论天涯网


jfM品论天涯网

然后我们让ChatGPT来讲讲TensorCore,并特地要求它尽量用人类的语气来写,但还是被AI鉴定出来了。jfM品论天涯网


jfM品论天涯网

这样看来,这个工具似乎也不是完全不能用。jfM品论天涯网

至于这次是不是ChatGPT发挥失常,你不妨也来鉴定看看:jfM品论天涯网


jfM品论天涯网

但其实吧,这回连OpenAI自己,用词都显得相当谨慎。jfM品论天涯网

官方数据明明白白写着,虽然这个新款打假工具比之前鉴定器都靠点谱,但其成功识别AI生成内容的概率,也仅为26%,还有9%的概率把人写的文本当成AI写的。jfM品论天涯网

(这准确率似乎跟蒙答案也差不多……)jfM品论天涯网

还用加粗文字昭告:我们这个鉴别器啊,它并不完全靠谱jfM品论天涯网


jfM品论天涯网

甚至还给自己这个新工具标了个“半成品”的标签。jfM品论天涯网

嗯?这可不是OpenAI一直以来锣鼓喧天鞭炮齐鸣的宣传方式啊。jfM品论天涯网

连自己家都不敢吹,还急急忙忙把打假工具推出来,OpenAI又是为哪般?jfM品论天涯网

ChatGPT应用泛滥jfM品论天涯网

说到底,还是ChatGPT太能以假乱真了。jfM品论天涯网

要想从一堆材料里精准地分辨哪些是AI生成,哪些是人类书写,别说普通人了,连专家都有点力不从心。jfM品论天涯网

Nature发文关注的一篇预印本论文就显示:ChatGPT瞎写的医学摘要,甚至能把专业审稿人骗住。jfM品论天涯网

在这项研究中,研究人员给ChatGPT看了50个来自TOP医学期刊的论文标题jfM品论天涯网

然后,要求ChatGPT在完全不知道文章内容的情况下,根据标题和期刊风格写摘要。jfM品论天涯网

给出的提示是酱婶的:jfM品论天涯网

请在[链接]上以[期刊]格式,根据[标题]写一篇科学摘要。jfM品论天涯网

(这里的链接实际上没有意义,ChatGPT不联网。)jfM品论天涯网

为了防止ChatGPT在训练数据中见过这些个论文,研究人员还特地挑选的是在2022年11月下旬和12月出版的论文。因为根据OpenAI官方说法,ChatGPT仅掌握2021年9月以前的信息。jfM品论天涯网

但就是这么重重设卡,当研究人员把原文摘要和ChatGPT写的假摘要一起拿去给人类科学家“盲审”时,令他们细思极恐的情况还是出现了:jfM品论天涯网

ChatGPT凭空写的摘要中,有32%成了漏网之鱼,审稿人压根儿没看出来是AI写的。反倒是14%真摘要,被认定出自AI之手。jfM品论天涯网


jfM品论天涯网

值得一提的是,研究人员还指出:jfM品论天涯网

审稿人错误地将一部分真摘要归类为ChatGPT生成结果,这表明他们在审稿时是保持着高度怀疑的态度的。jfM品论天涯网

而在教育界,老师们也开始受不了这种新型的“ChatGPT攻击”了。jfM品论天涯网

美国的一项千人调查显示,89%的受访学生都用过ChatGPT写家庭作业。jfM品论天涯网

连斯坦福这样的顶级学府也未能避免。TheStanfordDaily发现,已经有不少学生在期末考试中使用了ChatGPT。jfM品论天涯网

在受访的4497名斯坦福学生中,有17%的受访者表示,曾使用ChatGPT来协助他们完成秋季作业和考试。jfM品论天涯网

其中又有5%的人,连编辑都没编辑,直接把ChatGPT写的东西给提交了……jfM品论天涯网


jfM品论天涯网

图源:TheStandfordDailyjfM品论天涯网

打不过,就ban掉。jfM品论天涯网

纽约的公立学校就发布了禁令:禁止在学校设备和Wi-Fi中使用ChatGPT。jfM品论天涯网

他们给出的理由是:jfM品论天涯网

虽然该工具可能快速提供问题的答案,但它无法培养批判性思维和解决问题的能力,会影响学生们的学业和终身成就。jfM品论天涯网

在这样的背景之下,早在OpenAI官方动手之前,第三方检测工具就已经在社交媒体上引发了大量关注。jfM品论天涯网

比如华人小哥EdwardTian打造的GPTZero。jfM品论天涯网

这两天,他还推出了一个“专门为教育工作者打造”的升级版GPTZeroX。上线一天,就迎来了40万访问量和220万服务请求。jfM品论天涯网


jfM品论天涯网

OpenAI此前也和其他高校一起搞过一个名叫GPT-2OutputDetector的鉴别器,是基于RoBERTa打造的。jfM品论天涯网

不过这些工具的鉴定能力也未必就比人类强。jfM品论天涯网

前面提到的让ChatGPT写医学论文摘要的那项研究,也用上了GPT-2OutputDetector,结果显示,其鉴别准确率为66%,略低于人类专家的68%。jfM品论天涯网

是魔高一尺,还是道高一丈?jfM品论天涯网

由此看来,OpenAI急吼吼推出一个也不咋靠谱的AI鉴别工具,也不奇怪:jfM品论天涯网

再不有点表示,外界的压力扛不住啊。jfM品论天涯网

但在评论区,还是有盲生毫不留情地指出了华点:jfM品论天涯网

你们是真没想过,用这玩意儿反过来训练大语言模型,以后AI生成的文本就更难被发现了?jfM品论天涯网


jfM品论天涯网

但不管怎么说,OpenAI现在正在努力表现出给自己踩刹车的样子。jfM品论天涯网

除了鉴别器,有消息提到,他们正在尝试给AI生成内容加“水印”:jfM品论天涯网

比如在ChatGPT生成文本时,在其中嵌入一个“不易察觉的隐秘信号”,以表明文本来源。jfM品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取。 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考;转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网站编辑联系,我们将及时更正、删除,谢谢。 本站邮箱[email protected]