NLP中的encoder和decoder--688IT编程网

NLP中的encoder和decoder

这⾥复习下Sequence2Sequence任务到底是什么，所谓的Sequence2Sequence任务主要是泛指⼀些Sequence到Sequence的映射问题，Sequence在这⾥可以理解为⼀个字符串序列，当我们在给定⼀个字符串序列后，希望得到与之对应的另⼀个字符串序列（如翻译后的、如语义上对应的）时，这个任务就可以称为Sequence2Sequence了。

在现在的深度学习领域当中，通常的做法是将输⼊的源Sequence编码到⼀个中间的context当中，这个context是⼀个特定长度的编码（可以理解为⼀个向量），然后再通过这个context还原成⼀个输出的⽬标Sequence。

如果⽤⼈的思维来看，就是我们先看到源Sequence，将其读⼀遍，然后在我们⼤脑当中就记住了这个源Sequence，并且存在⼤脑的某⼀个位置上，形成我们⾃⼰的记忆（对应Context），然后我们再经过思考，将这个⼤脑⾥的东西转变成输出，然后写下来。

那么我们⼤脑读⼊的过程叫做Encoder，即将输⼊的东西变成我们⾃⼰的记忆，放在⼤脑当中，⽽这个记忆可以叫做Context，然后我们再根据这个Context，转化成答案写下来，这个写的过程叫做Decoder。其实就是编码-存储-解码的过程。

decoder

⽽对应的，⼤脑怎么读⼊（Encoder怎么⼯作）有⼀个特定的⽅式，怎么记忆（Context）有⼀种特定的形式，怎么转变成答案（Decoder 怎么⼯作）⼜有⼀种特定的⼯作⽅式。

好了，现在我们⼤体了解了⼀个⼯作的流程Encoder-Decoder后，我们来介绍⼀个深度学习当中，最经典的Encoder-Decoder实现⽅式，即⽤RNN来实现。

在今天介绍的Encoder-Decoder模型中，Encoder部分负责依次读⼊输⼊序列的每个单位，将其编码成⼀个模型的中间表⽰（⼀般为⼀个向量），在这⾥我们将其称为上下⽂向量c，Decoder部分负责在给定上下⽂向量c的情况下预测出输出序列。

并且在在⾃然语⾔处理应⽤中，Encoder和Decoder部分通常选择了RNN（LSTM）实现。

为什么我们要选择以RNN为基础的结构去实现Encoder-Decoder呢？：⾸先，RNN可以⽅便地处理可变长序列的数据。其次，由于RNN 中的隐层状态随着按时序读取的输⼊单元⽽不断发⽣变化，因此它具有对序列顺序的建模的能⼒，体现在⾃然语⾔处理任务中，即为对词序的建模能⼒。⽽词序也恰恰是⾃然语⾔处理任务中需要建模的重点。最后，RNN可以作为⼀个语⾔模型来预测出给定前⽂的基础上下⼀个字符出现的概率，这个特性使得其可以应⽤在各种⽂本⽣成任务中预测出语法正确的输出序列，从⽽实现Decoder的功能。

688IT编程网

NLP中的encoder和decoder

发表评论

推荐文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php中实现文件上传的函数

php文件上传类程序代码

413 request entity too large 解决方法 -回复

热门文章

php中用来导入其他文件的语句

php获取文件后缀名的方法

创建php文件方法

国家电网公司电子商务平台常见问题

【2018-2019】别克英朗说明书-实用word文档 (12页)

诺基亚E71常见问题以及解决方法

HXD3型电力机车故障应急处理

卫星电视中星9号解密方法及节目参数,长期可用

硬盘U盘等启动奶瓶beini详细步骤教程

BT3使用教程

破解网通铁通电信封路由器的几种方法

手把手教你WPA2加密无线网络

教你如何破解搜索到的无线网络

Get清风OD入门系列图文详细教程、破解做辅助起步

java rar破解原理

同余方程在密码学中的应用与破解

无限网络解码

winrar破解方法

macOS终端中的文件加密和解密技巧

rar加密原理

最新文章

php中实现文件上传的函数

413 request entity too large 解决方法 -回复

php实现编辑和保存文件的方法

php 配置文件的用法 -回复

突破php网站上传文件大小限制

php(实现url重写)

标签列表