自注意力机制

来自网友在路上 182882提问提问时间：2023-09-26 04:16:00阅读次数： 82

最佳答案问答题库828位专家为你答疑解惑

回顾以下注意力机制：
在这里插入图片描述

自注意力机制

Self-Attention的关键点在于
K $\approx$ V $\approx$ Q 来源于同一个X，三者是同源的，通过 $W_Q$ , $W_K$ , $W_V$ 做了一层线性变换。
接下来步骤和注意力机制一模一样。
在这里插入图片描述

$z_1$ 就是 thinking 的新的向量表示
对于thinking，初始词向量 $x_1$
现在我通过thinking machines这句话去查询这句话里的每一个单词和thinking之间的相似度
新的 $z_1$ 依然是thinking的词向量表示，只不过这个词向量表示蕴含了thinking machines这句话对于thinking而言哪个更重要的信息。
在这里插入图片描述
不仅规定了QKV同源，还规定了做法。

查看全文

99%的人还看了

相似问题

CATTI考试，拿证必看篇：CATTI备考，你不可不知的东西都在这里！

猜你感兴趣

版权申明

本文"自注意力机制"：http://eshow365.cn/6-13645-0.html 内容来自互联网，请自行判断内容的正确性。如有侵权请联系我们，立即删除！

上一篇: Allegro如何将丝印文字Change到任意层面操作指导
下一篇: jaeger不能抓取全部请求(设置抓取请求数)

晴海小常识分享

晴海小常识分享

自注意力机制

最佳答案问答题库828位专家为你答疑解惑

自注意力机制

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

晴海小常识分享

晴海小常识分享

自注意力机制

最佳答案 问答题库828位专家为你答疑解惑

自注意力机制

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

最佳答案问答题库828位专家为你答疑解惑