当前位置：首页 > 编程笔记 > 正文

已解决

NLP：Attention和self-attention的区别

来自网友在路上 152852提问提问时间：2023-10-09 03:45:37阅读次数： 52

最佳答案问答题库528位专家为你答疑解惑

核心思想是根据不同的上下文为不同的信息分配不同的注意力权重

效果：

Attention：它允许模型在解码时聚焦于输入的特定部分，从而更好地捕获上下文信息。
Self-attention：它帮助模型捕获输入序列内部的关系，无论这些关系的距离有多远。

计算：

Attention：权重是基于当前的输出（或解码器状态）和所有的输入（或编码器状态）来计算的。
Self-attention：权重是基于输入序列的每一个元素与其他所有元素的关系来计算的。

数学：

self-attention比attention约束条件多了两个：

1. Q=K=V（同源）也就是说，查询、键、和值都来自于同一个地方，即输入序列和输出序列是相同的，即模型在生成每一个输出时都对自己的所有输入（包括自己）进行加权求和。

2. Q，K，V需要遵循attention的做法

查看全文

99%的人还看了

相似问题

猜你感兴趣

版权申明

本文"NLP：Attention和self-attention的区别"：http://eshow365.cn/6-17576-0.html 内容来自互联网，请自行判断内容的正确性。如有侵权请联系我们，立即删除！

上一篇: 【软考】9.1 顺序表/链表/栈和队列
下一篇: 三十二、【进阶】hash索引结构

推荐回答

Nacos 架构原理2023/12/02
15、深度学习之正向传播和反向传播2023/12/02
CSS 多主题切换思路2023/12/02
盘点40个Android游戏Game源码安卓爱好者不容错过2023/12/02
LeetCode 8 字符串转整数2023/12/02
使用opencv将sRGB格式的图片转换为BT.2020格式【sRGB】【BT.2020】2023/12/02
使用Docker Compose搭建CIG监控平台2023/12/02
匿名结构体类型、结构体的自引用、结构体的内存对齐以及结构体传参2023/12/02
Docker篇之利用docker搭建ftp服务器可实现多用户上传2023/12/02
开源软件license介绍与检测2023/12/02