菜单总览

活动回顾 || 迎接大学生活的十堂课 第十讲:人机交互式机器翻译

  • 2017.12.10
  • 新闻
12月8日,腾讯人工智能实验室的黄国平博士在迎接大学生活的十堂课中的第十讲“人机交互式机器翻译”中,为同学们揭开了机器翻译的神秘面纱。

      黄博士首先介绍了机器翻译的现状。机器翻译同人工翻译一样,都是将源语言转化为目标语言。目前,不管是腾讯、搜狗、百度,还是谷歌、有道、必应,它们都投入了巨大的人力物力财力进行机器翻译的研究。接着,黄博士又从几个问题出发,“机器翻译与辅助翻译到底有什么区别,机器翻译是什么,该如何衡量机器翻译的性能”,我们继续了解机器翻译。

      接着,黄博士回顾了机器翻译的发展历程。机器翻译的源头要追溯到美苏冷战时期。美国为更好得翻译苏联的情报,想到用机器来代替人工进行繁杂的翻译工作。但起初受技术水平限制,并没有取得良好的效果。1954年到1966年一度处于停滞期。直到1982年,METEO天气翻译的出现,为机器翻译带来了一丝曙光。1993年,IBM模型的出现又为机器翻译的发展打开另一扇大门。

      目前,机器翻译仍面临许多困难。第一点,自然语言中普遍存在的歧义和未知现象:南京市长江大桥、休假式治疗、维修性拆除……第二点,机器翻译不仅仅是字符串的转换,在翻译类似于“青梅竹马”这样的文字时,机器也无能为力。第三点,机器翻译的解不唯一,而且始终存在人为的标准。这也是翻译专业的同学需要面对的问题。第四点,一些句式复杂、理解有难度的语句人类翻译起来也很困难。

      随后,黄博士介绍了统计机器翻译(SMT)和神经网络翻译(NMT)两种翻译方法。在IBM模型出现后,机器翻译全部采取的是统计翻译方法。2013年来,随着深度学习的研究取得较大进展,基于人工神经网络的机器翻译逐渐兴起。统计机器翻译主要通过翻译模型、语言模型、调序模型进行翻译。而神经网络翻译基于Word Embedding(词蕴含)技术进行翻译。统计机器翻译的优势在于忠实度,但是不一定符合语法。神经网络翻译的优势在于其流畅性,但容易“翻译过度”或者“翻译不足”,导致错得很流畅。

      接下来,黄博士讲到他目前的主要研究领域“人机交互式机器翻译”。如何将机器翻译融合到翻译流程中,是黄博士正在解决的主要问题。黄博士的研究团队提出译后编辑、交互式机器翻译、融合机器翻译的输入法以及提高术语翻译水平等解决方法。通过这些解决方法,机器翻译来辅助人工翻译,人工翻译反过来提高机器翻译。

      目前,人机交互式机器翻译仍存在着一些问题,如:长句和复杂句式的处理问题,弱规范、非规范化文本的翻译问题,双语资源缺乏问题等等。对于未来的趋势与展望,黄博士说人机交互式机器翻译会比目前预期的更加重要,希望得到更多人的推动。

同学感言

      感谢黄博士带来的讲座。通过这次讲座,我对人机交互式翻译的产生、发展以及应用有了大致的了解,也更加清楚该如何运用机器来辅助自己翻译。黄博士是理工科出身,思维严谨,富有逻辑,但是他的演讲不显沉闷,在演讲过程中,时不时可以听见大家欢乐的笑声。总得来说,这场讲座干货颇多,精彩纷呈。

——人文社科学院二年级本科生 周海林

      来听这次讲座主要还是抱着学习和了解知识的心态。随着科技发展,人工智能和翻译被看作是对立的两面,但其实如黄博士所讲,人机交互的模式才是现在最需要也最值得研究的。与其去考虑机器到底能不能取代人,还不如去学习如何提升自己,变成不能被取代的人。AI到底会如何发展,怎样发展,不是我们所能预料和把握的,我们能把握的只有自己和眼前的机会。

——人文社科学院一年级本科生 刘玥含