深度学习基础 | 注意力机制原理总结
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
Attention的产生
seq2seq将输入序列都压缩成一个固定大小的隐变量,就像我们的压缩文件一样,这个过程是有损压缩的,会迫使丢失许多输入序列中的信息。 存在着难以对齐的问题。比如中译音“我爱你”“I love you”,输入序列中的“我”应该与“I”对齐(贡献最大),然而在seq2seq模型中,“我”对"I","love","you"的贡献都是一致的
Attention的发展
Show, attend and tell: Neural image caption generation with visual attention
sort Attention hard Attention
Attention的计算
Soft attention:直接使用attention的权重对L个向量加权相加,这么做的好处是整个问题是可微的,可以利用BP end to end
总结
Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation
Effective Approaches to Attention-based Neural Machine Translation
global attention
Attention-Based Multi-Perspective Convolutional Neural Networks for Textual Similarity Measurement
multi-perspective sentence model
Structured Similarity Measurement
Attention-Based Input Interaction Layer
ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs
ABCNN-1
ABCNN-2
ABCNN-3
Graph Attention Network(GAT)
小结1
Attention is all you need
跳出原来千篇一律的attention形式,不使用CNN,不使用RNN,光靠attention,实现高并行化 抓取更强的长距离依赖关系
总结了attention的通用形式 提出了self attention,multi-head attention Transform结构
总结Attention的通用格式
提出self attention, multi-head attention
由于self attention 是对整个文本句求attention的,所以他能抓取到当前单词和该文本句中所有单词的依赖关系强度。这方面的能力显然比RNN的获取长依赖的能力强大的多。 此时不在用RNN的这种串行模式,即每一步计算依赖于上一步的计算结果。因此可以像CNN一样并行处理,而CNN只能捕获局部信息,通过层叠获取全局联系增强视野
Transform
Positional embedding:正如上面所说,self attention缺乏位置信息,这是不合理的。为了引入位置信息,这里用了一个部件position embedding。
residual connection无论是encoder还是decoder我们都能看到存在这residual connection这种跳跃连接。
Layer Normalization
Masked Multi-Head Attention
An Attentive Survey of Attention Models
number of sequences:a)distinctive:只考虑了涉及单个输入和相应输出序列的情况(例如seq2seq中的attention)
Number of abstraction levels
Number of positionsa)soft attention:它使用输入序列所有隐藏状态的加权平均值来构建上下文向量
Number of representations
Encoder-Decoder Memory Networks
下载1:OpenCV-Contrib扩展模块中文版教程 在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。 下载2:Python视觉实战项目52讲 在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。 下载3:OpenCV实战项目20讲 在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。 交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~