cnBeta.COM_中文业界资讯站

搜狗商用神经机器翻译获“创世技”颠覆性创新榜Top10

2018-10-12 来源: 中关村网 作者:lisa 次阅读

1.jpg

  10月11日,在四川成都召开了2018“创世技”颠覆性创新榜Top10的颁奖典礼。本次活动由成都市高新区承办,以颠覆性技术创新为突破口,旨在通过评选发现颠覆性创新人才,支持颠覆性创新项目发展,促进社会经济发展和科学技术进步。其中,搜狗公司的“商用神经机器翻译系统”获得“创世技”颠覆性创新榜Top10。

2.png

  搜狗神经机器翻译系统是搜狗公司全自主研发并已经成功商用的机器翻译技术,是业界最新型翻译系统,获得多项授权专利。在该系统的支持下,搜狗日均翻译请求3亿次,覆盖全球超5亿用户。

  AI下的神经翻译技术

  语言是人类区别其他动物的本质特性之一,它是人工智能的一个重要核心部分。我国人工智能产业发展迅速,其中自然语言处理的优势较为明显。当前最主要的应用方向是机器翻译,通过应用使人们可以实现便捷的跨语言交流,具有成本低、效率高、保密性强的特点。

  随着互联网不断加速经济、文化等领域的全球化进程,作为人们沟通的重要手段,跨语言自由交流的需求日益凸显。与此同时,企业面临着大量外文公文阅读、涉外会议翻译,普通民众在境外旅游、学习、生活中对翻译的需求也日益增长。神经机器翻译的出现解决了这些社会痛点,有效降低了翻译门槛。

  研制国际领先的互联网机器翻译技术,并实现大规模产业化应用,是国家跨语言网络信息安全的基石,在我国发展同各国的外交关系、经济和文化交流中发挥重要作用,对构建“人类命运共同体”,推进“一带一路”倡议下的国际合作、实施“走出去”战略具有重要意义。

  “该技术是业界最新型翻译系统,基于海量大数据不断训练优化”。现场工作人员称,搜狗神经机器翻译系统于2016年6月立项研发,是一款具有自主知识产权的机器翻译技术,并在2017年世界机器翻译学术大赛WMT上,获得中译英、英译中双向机器翻译全球第一。它使用循环神经网络生成翻译结果,与传统的统计机器翻译技术相比,结果更加流畅准确。

  已大规模商用的神经机器翻译

  目前,该产品已经实现大规模商业应用,深入融合到搜狗其他产品当中,包括同时提供语音及文字翻译功能的搜狗输入法、全球首个跨语言搜索的搜狗英文搜索和率先实现商用的搜狗机器同传系统、搜狗翻译app、刚刚上市的智能翻译硬件搜狗翻译宝等。在搜狗神经机器翻译技术的助力下,搜狗的产品和服务水平实现快速提升,并带来了可观的社会和经济收益。

  其中,搜狗输入法融入搜狗神经机器翻译技术,输入中文文字即刻转译为英文,实现中译英无缝对接,提供多样化表达方式。

  搜狗跨语言搜索系统,对接全球范围内多达万亿的英文信息,确保在用户提出英文搜索需求时,为用户找到最精准的英文网页信息及英文学术数据,轻松获取到一手的专业文献、资讯等。此外,英文搜索频道提供自动翻译功能,用户可以直接输入中文词语搜索出英文结果,打破了国外互联网公司在本领域的垄断地位,帮助中文用户共享全球文明降低了语言门槛。

  搜狗同传翻译系统,集成了语音识别、机器翻译、语音合成等先进技术,运行同传翻译时,屏幕上会实时显示出语音识别出的中文或英文,同时也会实时翻译成对应的英文或中文。目前,搜狗语音识别的准确率达到98%,支持最快400字每秒的高速听写,语音输入日频次高达4亿次,搜狗语音翻译的准确率则可以达到 90%。

  搜狗AI翻译硬件结合了神经网络机器翻译、语音识别、麦克风阵列、图像识别等多项技术推出的硬件产品,可用于点餐、问路、看展等用途。有效解决了境外旅游翻译产品面临网络信号不稳定和翻译不准确等痛点。支持文本、对话、语音、实景等多种翻译模式,还可以实现中英离线翻译,在没有网络时也能实现语音、实景拍照翻译功能。并且支持42种语言,覆盖全球200多个国家和地区。

  全球领先的人工智能技术

  由于人类语言本身的复杂性和多样性,导致计算机系统对于人类语言的理解水平一直处于相对较低的阶段,投入实际应用的研究成果寥寥无几。近年来,以“深度学习”为代表的人工智能技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破,能够识别语音的机器翻译逐渐走向普通大众。自2016年乌镇世界互联网大会上,搜狗首发中英文人工智能同声传译技术之后,引发了大家对机器翻译技术的热烈讨论。

  搜狗能够解决传统方法翻译导致知识获取耗时耗力的难题,项目积累的高质量翻译知识规模是权威国际机构NIST发布的数据规模100倍。同时攻克了机器翻译语种覆盖度受限的难题,使得资源稀缺的小语种翻译成为可能,并实现了多语种翻译的快速部署等。

  工作人员介绍,今年5月,国内顶级的NLP行业会议“NLPCC 2018”成功落幕。在备受关注的竞赛单元,搜狗公司的人工智能系统“搜狗知音”脱颖而出,击败了国内15支顶级人工智能团队,获得了语义理解比赛冠军。