当前位置:首页 > 编程笔记 > 正文
已解决

《论文阅读》LORA:大型语言模型的低秩自适应 2021

来自网友在路上 165865提问 提问时间:2023-10-27 10:16:06阅读次数: 65

最佳答案 问答题库658位专家为你答疑解惑

《论文阅读》LORA: LOW-RANK ADAPTATION OF LARGE LAN-GUAGE MODELS

      • 前言
      • 简介
      • 现有方法
      • 模型架构
      • 优点

前言

今天为大家带来的是《LORA: LOW-RANK ADAPTATION OF LARGE LAN-GUAGE MODELS》

在这里插入图片描述

出版:

时间:2021年10月16日

类型:大语言模型的微调方法

关键词:

作者:Edward Hu, Yelong Shen 等

第一作者机构:Microsoft Corporation

github:https://github.com/microsoft/LoRA

简介

为了降低现有模型在下游任务上的计算成本和时间成本,本文提出一种利用低秩的矩阵的方法,将高维空间映射到低维空间,在减小成本的同时不损失模型表现,下图为常见大语言预训练模型在下游任务

查看全文

99%的人还看了

猜你感兴趣

版权申明

本文"《论文阅读》LORA:大型语言模型的低秩自适应 2021":http://eshow365.cn/6-25939-0.html 内容来自互联网,请自行判断内容的正确性。如有侵权请联系我们,立即删除!