机器翻译三大核心技术原理 | AI知识科普 2

2018-7-6 10:46:12 4228 机器翻译技术原理人工智能科普

0 本帖最后由讯飞开放平台于 2018-7-6 10:47 编辑神经机器翻译讲完了基于规则的机器翻译和基于统计的机器翻译，接下来我们来看下基于端到端的神经机器翻译。神经机器翻译基本的建模框架是端到端序列生成模型，是将输入序列变换到输出序列的一种框架和方法。其核心部分有两点，一是如何表征输入序列（编码），二是如何获得输出序列（解码）。对于机器翻译而言不仅包括了编码和解码两个部分，还引入了额外的机制——注意力机制，来帮助我们进行调序。下面我们用一张示意图来看一下，基于RNN的神经机器翻译的流程：首先我们通过分词得到输入源语言词序列，接下来每个词都用一个词向量进行表示，得到相应的词向量序列，然后用前向的RNN神经网络得到它的正向编码表示。再用一个反向的RNN，得到它的反向编码表示，最后将正向和反向的编码表示进行拼接，然后用注意力机制来预测哪个时刻需要翻译哪个词，通过不断地预测和翻译，就可以得到目标语言的译文。 04 机器翻译的基本应用机器翻译的基本应用可分为三大场景：信息获取为目的场景、信息发布为目的的场景、信息交流为目的场景。以信息获取为目的的应用场景，可能大家都比较熟悉，比如说翻译或是海外购物，遇到一些生僻的词就可以借助机器翻译技术，来了解它的真正意思。在信息发布为目的的场景中，典型的应用是辅助笔译。大家应该都还记得本科毕业论文需要用英文写个摘要。不少同学都是利用谷歌的翻译，将中文摘要翻译成英文摘要，然后再做一些简单的调序，得出最终的英文摘要，其实这就是一个简单的辅助笔译的过程。第三大场景就是以信息交流为目的场景，主要解决人与人之间的语言沟通问题。 0
2018-7-6 10:46:12　　评论淘帖0 相关推荐 • 机器翻译三大核心技术原理 \| AI知识科普 6318 • 机器翻译：人工智能领域的关键核心技术 3409 • 神经机器翻译的方法有哪些？ 1479 • 机器翻译系统融合技术概述 4 • 机器翻译的发展历程 12029 • 换个角度来聊机器翻译 3210 • 机器翻译走红的背后是什么 921 • PyTorch教程10.5之机器翻译和数据集 0 • 机器翻译研究进展 408 • PyTorch教程-10.5。机器翻译和数据集 465 2 个讨论