讯飞开放平台
直播中

李党

6年用户 449经验值
擅长:嵌入式技术 存储技术
私信 关注

机器翻译三大核心技术原理 | AI知识科普 2

本帖最后由 讯飞开放平台 于 2018-7-6 10:47 编辑

神经机器翻译

讲完了基于规则的机器翻译和基于统计的机器翻译,接下来我们来看下基于端到端的神经机器翻译。

神经机器翻译基本的建模框架是端到端序列生成模型,是将输入序列变换到输出序列的一种框架和方法。
哈公司v.PNG


其核心部分有两点,
一是如何表征输入序列(编码),二是如何获得输出序列(解码)

对于机器翻译而言不仅包括了编码和解码两个部分,还引入了额外的机制——注意力机制,来帮助我们进行调序。
下面我们用一张示意图来看一下,基于RNN的神经机器翻译的流程:

Z.PNG


首先我们通过分词得到输入源语言词序列,接下来每个词都用一个词向量进行表示,得到相应的词向量序列,然后用前向的RNN神经网络得到它的正向编码表示。

再用一个反向的RNN,得到它的反向编码表示,最后将正向和反向的编码表示进行拼接,然后用注意力机制来预测哪个时刻需要翻译哪个词,通过不断地预测和翻译,就可以得到目标语言的译文。



04 机器翻译的基本应用


机器翻译的基本应用可分为三大场景:信息获取为目的场景、信息发布为目的的场景、信息交流为目的场景。

以信息获取为目的的应用场景,可能大家都比较熟悉,比如说翻译或是海外购物,遇到一些生僻的词就可以借助机器翻译技术,来了解它的真正意思。

FW.PNG

在信息发布为目的的场景中,典型的应用是辅助笔译

大家应该都还记得本科毕业论文需要用英文写个摘要。不少同学都是利用谷歌的翻译,将中文摘要翻译成英文摘要,然后再做一些简单的调序,得出最终的英文摘要,其实这就是一个简单的辅助笔译的过程。

第三大场景就是以信息交流为目的场景,主要解决人与人之间的语言沟通问题。

回帖(2)

苏海龙

2018-7-7 23:37:37
跟天书一样,看不懂
举报

李党

2018-7-9 08:56:23
你好!学习是一个过程啦~感兴趣的话多了解,时间长了就会开窍很多啦~
举报

更多回帖

发帖
×
20
完善资料,
赚取积分