什么是动翻译

自动翻译系统,也称为机器翻译系统,是指使用机器学习技术实时翻译大量文本的应用程序或在线服务。

虽然技术的概念和使用界面都十分简单,但是背后的科学和技术却极其复杂,汇集了机器学习(特别是深度学习人工智能)、大数据、 语言学、云计算和 Web API 等几种前沿技术。

Microsoft Translator是什么

Microsoft Translator 是由微软推出的自动翻译服务。自 2006 年以来,微软一直在内部使用自动文本翻译,并且自 2014 年起开始使用语音自动翻译。在众多微软的产品和服务中都有嵌入自动翻译功能,比如Office、Bing、Edge、Internet Explorer、SharePoint、Skype、小娜等。使用这些微软产品时,用户可以随时翻译文本,Skype 和小娜还支持实时语音翻译。所有这些应用的后台翻译技术都源自Microsoft Translator。目前微软自动翻译系统支持50多种语言的文本翻译,9种语言的对话模式实时语音翻译,和18种语言的语音识别和输出。

2011 年,Microsoft Translator 开始以 API 形式通过微软Azure云服务平台向第三方客户提供云端接入服务。目前全球已有数千家企业客户在使用此服务。常见的使用场景包括网站本地化,多语言客户支持,电子商务,社交媒体,网络游戏和商业智能等。2016 年3月微软在业内最先推出语音翻译 API服务,目前支持9种源语言的对话模式实时语音翻译,并且还在不断增加支持的语言。

Microsoft Translator API 可以轻松实现跨平台接入到第三方的系统及应用,软件开发者可以到 Azure DataMarket 注册使用,获得每月200万字符以内的免费服务。同时,Microsoft Translator 还向广大消费者提供免费下载的应用程序,包括智能手机APP和网页翻译Widget。

文本翻译的工作方式

Microsoft Translator 建立在微软在自然语言领域逾十年的研究基础之上。现代翻译系统不再手动编写规则进行语言转换,而是将翻译视为对现有人工译文所用语言及相互转换的学习问题,并利用了应用统计学和机器学习方面的最新成果。

所谓的"平行语料库"在很大程度上充当现代的罗塞塔石,基于语境为许多领域提供单词,短语和习语翻译。统计建模技术和高效算法帮助计算机解决了解读(检测训练数据中源语言和目标语言之间的对应关系) 以及解码 (为新输入句子找到最好的翻译)等问题。Microsoft Translator 将统计学方法与语言信息相结合,建立模型。

这种方法并不依赖词典和语法规则,它利用单词所在的整个语境而非单个单词来为整句提供最佳的译文。

Microsoft Translator 可在任何平台上的 web 或客户端应用中使用。通过利用行业标准协议(SOAP, HTTP, REST 和 AJAX),开发人员发送源文本到服务,并附上表示目标语言的参数,然后该服务传回译文,以供客户端或 web 应用程序使用。

Microsoft Translator 服务托管在微软数据中心上,享有和其他微软云服务 -Office 365, Bing, Azure 共同的安全性,扩展性,可靠性和不间断可用性。

语音翻译的工作方式

Microsoft Translator语音翻译功能最初仅通过微软的Skype Translator实时语音翻译功能和 Microsoft Translator应用程序提供服务。现在该功能通过最新版的API向所有开发人员和第三方应用开放。

虽然语音翻译看上去是个简单的过程,但这比仅仅是将现有"传统"人机语音识别引擎插入到现有文本翻译引擎的过程复杂得多。

要正确地将"源"语音从一种语言译成另一种"目标"语言,系统需要完成四个步骤。

  1. 自动语音识别,将音频转换为文本
  2. TrueText: 一种使文本标准化, 更适合翻译的技术
  3. 通过上述的文本翻译引擎进行翻译,但是利用专为现实生活口语会话开发的翻译模型
  4. 文本到语音转换,必要时产生译文的音频。

动语音识别 (ASR)

ASR 基于对数千小时音频语言的分析,借助深度神经网络 (DNN) 。此模型基于人与人之间的交互,而非人对机指令训练,可产生为正常对话优化的语音识别效果。为达此目的,需要大量的数据,以及较传统人对机 ASR 更大的深层神经网络。

TrueText

正如人与人之间的交谈一样,人类的口头表达并完美,常常不如自己认为的那样清晰和简洁。TrueText 技术通过删除语音中不流利 (赘词,如"嗯","啊","和","比如"),口吃和重复的部分,使文本更贴近地反映用户意图,还通过添加断句,修改标点符号和大小写,使文本更易读和更容易翻译。下图通过真实的示例描述了 TrueText 执行的各种转换,以使表面文字标准化。

经过 TrueText 技术的处理,标准化的文本可以被译成 Microsoft Translator 支持的50多种语言的任意一种。

除了这个标准的翻译,我们还开发了新的语音翻译引擎。用更多的口语文本语料库扩展目前以书面文本训练为主的翻译模型,从而为口语会话类翻译构建更好的模型。这些模型也可通过"语音"标准类传统文本翻译 API 提供服务。

文本到语音转换

如果目标语言是Microsoft Translator支持的18种文本到语音转换语言之一,而且需要音频输出,则可使用语音合成将文本转换成语音输出。