人工智能在最近的“科大讯飞造假风波”事件中,再一次站到风口浪尖,成为人们“攻击”或“吹捧”的对象。人们对AI的态度似乎很纠结,一方面对其营造出解放人力的未来光景充满期待,另一方面又为自己岗位的可替代性感到深深的担忧。
这种“又爱又恨”的矛盾心理,恰恰说明这是一门正在高速发展中的技术。大多数人由于技术门槛的存在,只能从文字描述中一窥其原理,也就不免存在过高,或过低估计的情况。从火车、电力到互联网,再到如今的量子计算、人工智能,无一不经历着从期待、恐惧,到正确看待、利用,这样一个大众认知的过程。小线菌今天从科大事件焦点的机器翻译切入,从其诞生到如今被大众接受,同时引发的恐慌和质疑,来聊聊AI技术落地的“一般规律”。
在许多人的印象里,翻译和律师一样,是一个长期伏案工作,需要和各种文件打交道的角色。其实技术的参与早在语言的学习阶段就开始了。正如将 ATM 视为金融科技的第一代硬件设施一样,电子词典也可以看做是技术支持语言学习的第一步。而辅助翻译完成工作的 NLP 技术也同样经历了这样一个“从基于词、到基于短语、到基于整句”的发展过程。
这项技术的发展可谓一波三折,从二十世纪三十年代初由法国科学家提出的,用机器来翻译的想法萌芽,到1954年美国乔治敦大学在IBM公司协同下,完成英俄机器翻译实践,正式标志着该领域的研究开端。
仅仅十年之后,美国科学院成立的语言自动处理咨询委员会就全面否定了机器翻译的可能性。而后飞速更新的技术和日益增长的国际交流一起,再次将这个课题拉回了研究者的视野。发展至今,机器翻译到底能够将“翻译”这件事的完成度推到百分之几?又在逐步融入民众生活的同时带来了怎样的便利和恐惧呢?
机器翻译进入大众的视野是从免费的在线翻译网站或是手机翻译软件开始的。语言学习者们爱用的词句对应网站 Linguee 就是其中的经典,通过大量的数据沉淀,能够按照相关性排序给出使用者最符合语境的解决方案推荐。人们在长长的对应列表里搜索自己认为最为准确的译法,也一度热衷于调侃机器翻译给出的结果。连职业翻译都会使用自己的语料库来提示之前翻译过的词,减少重复工作(MAHT)。我们意识到,机器真的做到了“寻找对应词”,并且由于数据特性,这种寻找非常高效,但是好像没有那么准确。
而语音识别和图像识别技术,则丰富了传统的文本处理机器翻译入口,给此类网站和应用带来了新用户和使用情境的增加。往往认为境外游最大的增长障碍除了费用就是语言障碍。往前推五年也许确实是这样,而今来讲,后者的影响越来越小了。当然技术的进步远不仅限于此。
2016年谷歌发布基于神经网络翻译的 GNMT 系统。一改之前统计翻译时代的僵硬感,不少同学试用之后都表示,这一代翻译器更加接近人类的翻译结果,能做到更好的“信息传达”。
人工智能和人类翻译的小竞赛每天都在进行,偶尔机器翻译还能占到上风。机器能够更好的理解(拆分)和表达(重新组织)一个句子,同时通过映射原理甚至能够进行零数据的翻译,我们有理由相信未来技术的进步能够带来更加平滑的使用体验。
而一部分人类翻译的角色也从调用语料库进行辅助,变成校对机器完成的通篇翻译,人类和机器还是在配合,但是形式在不断更新。
这次“翻译风波”中科大讯飞后面给出的回复也是基于此观点。从信息的接收和输出角度来给翻译过程进行梳理的话,我们通常理解上的机器翻译,应该完成的是整个链条,也就是从讲者语音的接收开始,到完成翻译环节后将翻译结果以文字或语音的方式输出。但此次事件中愤怒的人类翻译官Bell先生自己完成了前面所有步骤,却在最后的输出上由机器代工,仿佛是又机器翻译官完成了全部步骤上台领奖一样,着实让人生气。事情的公道还是应该在具体的合同协议以及前期是否有误导性宣传上进行考证,我们这里暂且不表。先来说说科大讯飞在这个环节中运用了何种核心技术。
根据2017年年报显示,其核心技术分别为语音合成、语音识别、图像识别、机器翻译和认知智能。除最后一种多应用于教育领域之外,其他的四种技术分别参与了刚才我们说的翻译链条的三个关键环节。而当事人所说的“造假”应该指的是会议上的翻译过程并无机器翻译技术的调用,反而只有语音识别和合成,造成一种剽窃他人作品之嫌。仅以一次活动的技术运用情况来断言机器翻译技术不存在还是有些局限的,但是机器翻译到底能做到什么程度却是值得我们思考的。
对于正在发展中的技术,展望未来成了一些人津津乐道的事情。AlphaGo战胜李世石和柯洁后,“AlphaGo战胜彻底战胜人类意味着什么?”“他的棋力还能增长吗?”等等类似于“AI将取代翻译”“大部分岗位都将被人工智能取代”的文章铺天盖地。技术造神可能要算的上近代的几大谣言来源之一。
人们的恐慌来自于不了解技术的边界,目前人工智能到底处于一个什么样的发展阶段?孩童可以去识别的事物,交给机器需要花多久来分析?比较常见的观点认为现在的人工智能技术还处于一个弱人工智能的状态,还未实现真正的类人类的推理能力。曾经描绘的美好愿景里有一部分已经实现,但是大部分还需要更多科研投入或者也许还无法实现。
而科技企业在人工智能的发展中在经历了人才、技术的鸿沟后,正处于行业落地和产品应用的第二阶段。要能够真正通过市场的检验实现量产,还需要数年时间。
在天生爱风口的创投领域,一般在技术的大范围应用前先要经历一级市场的热捧,从近五年的统计数据来看,机器翻译的投资热度已有所下降,技术层面的关注度排名已经跌出前十。这并不是意味着这个技术发展陷入了停滞,反而是因为其已经逐渐走入寻常百姓家,能够在足够多的应用场景下帮助提高效率。
最后我们再转过头来说说翻译这件事,从其本质上来讲,翻译是能够打破语言或者语言背后的文化差异带来的沟通障碍,至于是选择合适的词还是故事来解释,是相对开放的。这和 NLP 能够完成的“寻找对应词”或是“信息传达”还是有一定的区别。机器翻译一路磕绊的发展,和人类语言的复杂性不无关系。倒也不是说因为复杂所以无法穷尽或无法被替代,反而是因为它的综合性,难以在短时间内被完全替代。机器的优点是反应能力和复制能力,相比成为一个合格议员要经历的漫漫学习道路,机器的习得性更加高效,二者或许能够发挥各自的优势,带来更多的进步。
其实科大这件事从正面看至少能够让一部分对于机器翻译的迷信被打破,那些觉得可以完全不用学习外语的家长冷静下来或许能够意识到,人工智能并非无所不能,技术和人的关系也远非互相替代那么简单。
转载请注明出处。