发 帖  
机器翻译三大核心技术原理 | AI知识科普 2
2018-7-6 10:46:12  633 机器翻译 技术原理 人工智能 科普
收藏 0 收藏 推荐 0 推荐
分享
本帖最后由 讯飞开放平台 于 2018-7-6 10:47 编辑

神经机器翻译

讲完了基于规则的机器翻译和基于统计的机器翻译,接下来我们来看下基于端到端的神经机器翻译。

神经机器翻译基本的建模框架是端到端序列生成模型,是将输入序列变换到输出序列的一种框架和方法。
哈公司v.PNG


其核心部分有两点,
一是如何表征输入序列(编码),二是如何获得输出序列(解码)

对于机器翻译而言不仅包括了编码和解码两个部分,还引入了额外的机制——注意力机制,来帮助我们进行调序。
下面我们用一张示意图来看一下,基于RNN的神经机器翻译的流程:

Z.PNG


首先我们通过分词得到输入源语言词序列,接下来每个词都用一个词向量进行表示,得到相应的词向量序列,然后用前向的RNN神经网络得到它的正向编码表示。

再用一个反向的RNN,得到它的反向编码表示,最后将正向和反向的编码表示进行拼接,然后用注意力机制来预测哪个时刻需要翻译哪个词,通过不断地预测和翻译,就可以得到目标语言的译文。



04 机器翻译的基本应用


机器翻译的基本应用可分为三大场景:信息获取为目的场景、信息发布为目的的场景、信息交流为目的场景。

以信息获取为目的的应用场景,可能大家都比较熟悉,比如说翻译或是海外购物,遇到一些生僻的词就可以借助机器翻译技术,来了解它的真正意思。

FW.PNG

在信息发布为目的的场景中,典型的应用是辅助笔译

大家应该都还记得本科毕业论文需要用英文写个摘要。不少同学都是利用谷歌的翻译,将中文摘要翻译成英文摘要,然后再做一些简单的调序,得出最终的英文摘要,其实这就是一个简单的辅助笔译的过程。

第三大场景就是以信息交流为目的场景,主要解决人与人之间的语言沟通问题。

2018-7-6 10:46:12   评论
2 个讨论
跟天书一样,看不懂
2018-7-7 23:37:37 评论

举报

你好!学习是一个过程啦~感兴趣的话多了解,时间长了就会开窍很多啦~

只有小组成员才能发言,加入小组>>

32个成员聚集在这个小组

加入小组

创建小组步骤

关闭

站长推荐 上一条 /9 下一条

快速回复 返回顶部 返回列表