所以,去年咱们就在中国传媒大学摆下擂台,搞了场“人机大战”,北京各大高校同传专业的优秀学生守擂,AI翻译的优秀代表时空壶攻擂。
去年比赛现场
在各种剑拔弩张中,AI差一点点就翻车了……
网络不好,没有拉来运营商的专线,直接用的手机5G网络,网络丢包导致第一轮就漏译了两句。到第二轮日语比拼的时候,AI又听岔了一个同音词。
好在后面AI逐渐进入状态,最后以小优势获胜。
可能有个别差友还不熟悉时空壶,咱们也再简单介绍下。
时空壶是专门搞人工智能翻译设备的,也算是咱老朋友了,主攻AI翻译产品,在海外卖得非常火爆。
今年3月,时空壶就靠一手硬科技,火到了《新闻联播》上,《新闻联播》平时也就30分钟,这次报道他们报道了近四分钟……
报道主要聊了两点,就是时空壶把“听得清”和“翻得准”这两件事儿,又往前推了一大步。
翻译本质上就是“交流”,它不只发生在安静的会议室里,也发生在商场或展会,很多时候翻译耳机出问题,不是翻译太烂,而是没听清楚,或者被杂音干扰。
为了解决这个问题,时空壶捣鼓出了矢量降噪技术,通过算法锁定佩戴者的方向和距离,确保只录入他的声音,再对那些恼人的杂音进行降噪。
当然,语音交流的复杂性远不止这些,比如,五花八门的口音和方言,读音相似的字词,以及各种专业术语。
以往的翻译都是词对词的“直译”,你说句手冲,翻译蹦个hand-washing,全然不管你前面在点咖啡……
为了实现“直译”到“意译”,时空壶开发了全新的AI同传大模型,它能像人一样,根据对话主题,联系上下文,做到精准表意。
今年,时空壶拉上了同传领域的专家学者们,研究起了AI翻译技术分级,并且高调宣布自己已达到L3级别,语音同声传译。
一边呢,是AI翻译迅猛进步,另一边,去年比赛,像咱们英语评委沈洲榕老师就提出“一个成熟的产品跟一个尚未成熟的人类译员相比,我觉得这不是一个公平的竞争”。
干脆,我们决定今年在深圳举办了一场更激烈的决斗,人机大战2.0。
这次时空壶从客场换到了主场,所派出的选手,也是最新一代的W4Pro AI 同传耳机。
而人类翻译队呢,邀请也都是从业多年,经验丰富的高级译员。
其中有人担任过三菱化学、广汽丰田、川崎摩托等多个大型企业的翻译,有人给国家级政要担任过翻译。
老实说,我要是AI的话,看到这阵容直接汗流浃背了,这也算是赛博时代的“舌战群儒”了吧……
在双方选手都有升级的情况下,就让我们看看这一次对决,孰强孰弱~
为了确保公平公正,同时也让大家能了解到点真东西,我们邀请了语言学专家、AI领域专家以及对应的外语评委等多人评分,评分围绕准确性、流畅度、专业领域适配、文化适配多维度展开。
既然搞事,那就不嫌事大,为了保证玩的都是真的,咱们也对这场比赛进行了直播。
看评论你就知道了,这次的强强PK,有多让观众们上头。
第一个环节是基础翻译比拼,由4名外国人分别念一段对应自己母语的文本,主题跨度从世界文化遗产到城市旅游,涉及到许多专业名词、文化性词汇。
在正式比赛前三天,我们公布了题库的类目,题库涵盖了城市旅游、信息技术、医疗健康等,以便双方准备,但是具体会考到哪一道题,咱们是在现场抽取,双方事前都是不知道的。
这些文本有多难呢?现场听着,感觉有些外国人自己念起来都有点磕绊……
以日语比拼的内容,城市旅游为例,里面既有俗语,“西安有个钟鼓楼,半截插在天里头”,又有各种专业名词,明神宗万历十年,巡抚,碑文,非常需要文化底蕴。
就结果而言,双方水平都很高。
但在表述精准性这块,尤其长难句的翻译表现上,AI 表现确实是有些惊艳。
比如,AI完整的翻译出了“位于西安东南西北四条大街交汇处的钟楼”,而人类译员译文是“东南西北,处于这四条路中心的钟楼”。
同时,遇到信息量大,或者信息太生僻的情况,人类译员出现少量漏词,而AI基本上都能抓住。像这轮比拼中的“碑文记载”,双方的表现也出现了差异。
这事其实不难理解,在同传翻译上,人类的“数据库”往往是个体的经验,而AI可以联网学习,汇聚了无数个体的经验。
不过,有那么点儿成也数据,败也数据的味……
这轮比拼中,AI出现了一个人类几乎不可能会犯的错误,把“位于西大街的迎祥观”中的迎祥观翻译成了迎宾馆。
北大教授、AI领域专家邹月娴解释道,“之所以会出现这样的问题,是因为训练人工智能的数据里,有很多位于大街上的迎宾馆,这个词权重很高,AI是按照概率输出的,缺少知识驱动”。
这一轮以249VS243的比分,人类微落后于AI。
而到了法语比拼环节,可能是故意想上点难度吧,邀请了一位来自摩洛哥的小哥来朗读。
摩洛哥的语言环境非常复杂,第一官方语言是阿拉伯语,法语只是第二官方语言,朗读者的口音、语速和表达会对译员产生影响。
这轮比拼完,我有这样两个感受。
一来,连续几轮比下来,能明显的感受到,人类译员和机器各有优势。
人类同传给人的听感和交流感是AI目前很难比拟的。
人类输出给人的感觉是流畅,输出均匀而且及时,而AI 的输出,间隔时间比较长,会有4-5秒的延迟,这种延迟有时候会让人懵一下,“哎,还没开始嘛”?
在刚开始处理信息,以及需要处理语速快,信息密的信息时,这种延迟更明显。
邹教授对此也做了进一步解释,“AI强在翻译时,能通过上下文,生成准确的内容出来,但最开始的时候,它没有上下文能看,所以它要读完第一句才开始,当它开始输出后就会非常流畅”。
但与此同时,口音、听感、比赛都会影响人类听感,造成压力,这轮选手明显是有点紧张,信息遗漏了几个,这就不如AI来得稳定了……
这两点在西语比拼中也出现了。
西语评委靳笛给出了非常中肯且犀利的点评:“人类译员其实已经非常专业了,但确实在翻译的过程中,可能句子结构中有一个词没有理解,就会导致意思有一定的偏差”。
“如果我们考虑到翻译的语速的话,同声传译是跟着讲者去翻译,不仅是表达意思,也体现出了讲者当时的语气和情感,如果我们翻译内容跟原文相差太多,这个信息就没法传达了,或者讲者已经说完了,但翻译还有内容再出,就会影响到后面的讲话”。
第一环节的情况差不多是这样,咱们也就不一一列举了。
尽管在延时上还有一些优化的空间。但是凭借更精准且全面的翻译表现,W4ProAI同传耳机还是在一众同传老司机中杀出了重围,拿下了1020分,领先于高级译员队的912分。
而第二环节,则是关键词提取大比拼,有点类似于听力题,双方选手根据听到的内容抢答。
对于AI翻译队来说,这个环节是有点小劣势。因为AI队需要基于中文翻译的结果,再根据中文译文选择答案,转换耗时更久。
这个环节的比分非常焦灼,最后是150VS150,第二轮打平手。
但当硝烟散尽,这场人机对决的胜负,其实没有那么重要。
它更像是一面镜子,映照出了当前阶段 AI 与人类译员各自的核心价值。
作为这场对决AI的唯一代表,时空壶W4Pro无疑贡献了诸多高光时刻,从对文化性词汇的把握到专业术语的翻译,都从容驾驭,代表了现阶段AI同传技术的顶尖水平。
也让很多观众得以直观感受,AI翻译已经从“生硬直译”的初级工具,来到了能精准表意、同声传译的L3。
当然,这面“镜子”也映照出了未来发展方向:更快,向无延迟的自然交流前进;更懂,洞悉文化内涵。
对于人类来说,这次对决也是非常宝贵的经验。
参加这次比赛的日语选手,也向我们透露了些感受:“我原来以为AI翻译速度会比我快一点,但是我发现我会比它快,可准确度它会比我高,词库比我更全,我可能某些词收集不到,收获还蛮大的”。
当我们问到,作为人类译员,现在有没有在使用AI翻译工具时,她表示:“我也有在感受AI,会让AI同步给我出翻译结果,看谁的更好,能帮助我快速学习很多不会的单词,但是AI可以教你,但是最终结果对不对,需要人类再核验”。
怎么说呢,让我想起了这张图……
包括翻译界资深学者赵晨威也提到了,有些能力是AI短期内无法复制的,“有些沟通我们是希望传达信息,有些沟通我们是希望建立信任,前者看重效率,而对于后者温度肯定是最重要的”。
退一步说,交流不仅仅是语言,也可能是见面时的那一个拥抱……
至于未来?
赵老师也给出了一段总结,说得很好,“翻译一直都是一个很有价值的职业,帮助不同文化、语言的人实现交流,所以译员们千万不要放弃,但是千万不要当鸵鸟,忽视面前的变化,AI绝对彻底颠覆这个行业”。
我在想,在未来,沟通的边界,一定是被人类和AI一同消融的。
比如现在很多书籍、信息因为人力限制无法被翻译,未来咱们就派AI干苦力,人类做最后的优化和核查,既能保证翻译速度也能保证翻译质量。
说不好同声传译也可以这样,把费劲的丢给AI,自己做审查和跨文化沟通顾问~
甚至,咱们可以增加一个人机协同的队伍,把人类的智慧跟AI的效率揉到一起,说不定能碰撞出更多启发和创意~
也许,未来我们还会举办人机大战3.0,不知道到那个时候,AI翻译又会进展到什么程度呢……

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】