完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
本帖最后由 讯飞开放平台 于 2018-7-6 10:47 编辑
神经机器翻译 讲完了基于规则的机器翻译和基于统计的机器翻译,接下来我们来看下基于端到端的神经机器翻译。 神经机器翻译基本的建模框架是端到端序列生成模型,是将输入序列变换到输出序列的一种框架和方法。 其核心部分有两点,一是如何表征输入序列(编码),二是如何获得输出序列(解码)。 对于机器翻译而言不仅包括了编码和解码两个部分,还引入了额外的机制——注意力机制,来帮助我们进行调序。 下面我们用一张示意图来看一下,基于RNN的神经机器翻译的流程:
首先我们通过分词得到输入源语言词序列,接下来每个词都用一个词向量进行表示,得到相应的词向量序列,然后用前向的RNN神经网络得到它的正向编码表示。 再用一个反向的RNN,得到它的反向编码表示,最后将正向和反向的编码表示进行拼接,然后用注意力机制来预测哪个时刻需要翻译哪个词,通过不断地预测和翻译,就可以得到目标语言的译文。 04 机器翻译的基本应用 机器翻译的基本应用可分为三大场景:信息获取为目的场景、信息发布为目的的场景、信息交流为目的场景。 以信息获取为目的的应用场景,可能大家都比较熟悉,比如说翻译或是海外购物,遇到一些生僻的词就可以借助机器翻译技术,来了解它的真正意思。 在信息发布为目的的场景中,典型的应用是辅助笔译。 大家应该都还记得本科毕业论文需要用英文写个摘要。不少同学都是利用谷歌的翻译,将中文摘要翻译成英文摘要,然后再做一些简单的调序,得出最终的英文摘要,其实这就是一个简单的辅助笔译的过程。 第三大场景就是以信息交流为目的场景,主要解决人与人之间的语言沟通问题。 |
|
相关推荐
2 个讨论
|
|
只有小组成员才能发言,加入小组>>
4187 浏览 0 评论
3288 浏览 0 评论
4097 浏览 0 评论
3494 浏览 0 评论
投融资 | 保险业领导者OneDegree融资1270万美元
2969 浏览 0 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-4-19 10:10 , Processed in 0.504844 second(s), Total 40, Slave 31 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号