注意力机制最早是在视觉图像领域提出,但真正得到广大关注是从Google mind团队发表的论文开始,使用attention机制在RNN模型上来进行图像分类。随后,Bahdanau等人使用attention机制在机器翻译任务上将翻译和对齐同时进行,注意力机制开始应用到自然语言处理领域。0 注意力机制的主要学习内容1)注意力机制的基本理论2)注意力机制的运用1 基本理论 注意力机制模型的构建是受到人类视觉的启发,当在看一样物体时,其实并不是一次性就把该物体的各个方面都看到,大多是根据自身需求,对该物体各个位置的注意力分布是不一样的。在CNN和RNN中,提取出的特征都是赋予相同的权重,因此重要特征没有得到重视,而Attention这种思想可以对特征进行加权处理,加强重要特征对分类的作用,具体结构如下图1所示。图1 attention机制结构2 注意力机制的总结与应用 Attention的出现就是为了两个目的:1. 减小处理高维输入数据的计算负担,通过结构化的选取输入的子集,降低数据维度。2. “去伪存真”