LLaMA参数微调方法

2023-09-17 14:44:12

1.Adapter Tuning:嵌入在transformer中

新增了一个名为adapter的结构,其核心思想是保持模型其他原始参数不变,只改变adapter的参数,其结构如下图所示:

在这里插入图片描述

1.在每一个transformer模块最后都加入一层adapter。

2.adapter首先使用一个feedforward将高维特征映射到了低维特征。

3.低维特征经过一层非线性层之后将低维特征映射回高维特征。

2.Prefix Tuning:构造虚拟token

1.在输入token之前构造一段任务相关的虚拟token作为Prefix。

2.在训练时可以只更新Prefix部分的参数,而transformer预训练的参数固定。

【注】该方法与构造Prompt类型,但是构造人为构造的显示提示并且构造参数不可更新,而Prefix是隐式构造。

3.Prompt Tuning

与Prefix Tuning相比之下,prompt tuning使用单个提示表示,该表示前置于嵌入式输入。除了需要更少的参数外,所提出方法允许transformer更新中间层任务表示,通过输入示例进行上下文化。

Prompt tuning只需要为每个任务存储一个小的特定于任务的提示,并使用原始的预训练模型支持混合任务推理。
P-Tuning V1只在输入层加入了Prompt,而P-Tuning V2则在每一层都加入了Prompt,解决了深度提示优化的问题。另外P-Tuning V2还提出了Multi-task learning解决不同规模和任务的适配性问题。

4.LoRA

在这里插入图片描述

LoRA的核心思想是用一种低秩的方式来调整这些参数矩阵,在数学上低秩意味着一个矩阵可以用两个极小的矩阵来近似。它提出用两个小矩阵近似一个大矩阵,先降维(减小计算量)后升维(维持维度不变)。具体来说是固定原始模型的参数,只训练降维矩阵A与升维矩阵B。最后用原始模型参数与B矩阵相加。

A矩阵一般用随机高斯分布初始化,维度上是降维;B矩阵用0矩阵初始化,维度上是升维。

参数更新 :W = W + A*B。

梯度更新 :在微调过程中,计算关于矩阵A和矩阵B的损失,在优化过程中对A和B进行更新,原始矩阵W保持不变。

代码具体操作:①将原始矩阵W参数冻结。②新引入两个线性层对应图中两个矩阵,先降维后升维。③LoRA主要实现了两分支通路,一条分支为已被冻结weight参数的原始结构,另一条分支为新引入的降维再升维线性层。

5.QLoRA:相比于LoRA进一步降低显存消耗

而QLoRa更进一步,引入了4位量化、双量化和利用nVidia统一内存进行分页。

分页优化器、双量化、增加Adapter。

更多推荐

RCP-第2章 ROS+Matlab

RCP系列文章第一章Matlab安装第2章ROS+MatlabMatlab安装RCP系列文章前言一、Matlab获取二、安装1.解压10.软件安装中(我的电脑大约需要10分钟)12.完成)三、破解1.打开安装包解压后的【R2018b(64bit)】中的【Crack】文件夹2.全选该文件夹下所有文件鼠标右击选择【复制】4

企业电子招投标采购系统——功能模块&功能描述+数字化采购管理 采购招投标

​功能描述1、门户管理:所有用户可在门户页面查看所有的公告信息及相关的通知信息。主要板块包含:招标公告、非招标公告、系统通知、政策法规。2、立项管理:企业用户可对需要采购的项目进行立项申请,并提交审批,查看所有的立项信息。主要功能包含:招标立项申请、非招标立项申请、采购立项管理。3、采购项目管理:可对项目采购过程全流程

评价指标分类

声明本文是学习GB-T42874-2023城市公共设施服务城市家具系统建设实施评价规范.而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们1范围本文件确立了城市家具系统建设实施的评价原则、评价流程,给出了评价指标,描述了方汁.并却定了评价要求。家具系统建设实施的评价。通过文中的规成本文件必不可少的条款

【C++ 程序设计】实战:C++ 实践练习题(11~20)

目录11.循环计数、变量赋值、递增运算12.递归序列13.遍历输出结构体数组中每个元素的姓名和年龄14.指向整型变量的指针和一个整数作为参数15.从键盘读取字符,并执行操作,打印字符结果16.找出三位数中全部的水仙花数17.输入数字返回英文单词18.分科输入学生成绩计算总分、平均分19.创建一个5x5的二维数组,并按照

STM32 OLED屏幕显示详解

目录1.OLED介绍2.OLED如何显示一个点?内存管理​编辑​编辑页地址模式水平地址模式​编辑垂直地址模式​编辑3.OLED显示图片用到的库函数:向OLED写命令的封装:显示图片代码示例:1.OLED介绍OLED是有机发光管(OrganicLight-EmittingDiode)的缩写,是一种新兴的平面显示屏技术。与

PSP - 蛋白质序列提取 Transformer 蛋白质语言模型 ESM2 特征

欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/132888139蛋白质语言模型ESM(EvolutionaryScaleModeling)是一种利用深度学习技术来预测蛋白质结构和功能的方法。

pixel2的root过程

用adb连接手机首先学会用adb连接手机可以配置在主机Windows和虚拟机上手机打开设置,连续点击版本号进入开发者模式点击进入开发者选项,允许USB调试,连接在电脑上,在手机授权对话框中允许电脑调试连接完成后,输入adbdevices查看一下进行刷机先解锁oem输入上述命令上述图片已经解锁了oem锁没有解锁的话输入f

【跟晓月学shell脚本】掌握shell脚本变量原理及概念

前言跟晓月一起学shell,死磕shell脚本,让shell脚本学习不再难。想学习更多shell脚本的案例,可以前往我的师父的shell脚本专栏:shell脚本从入门到实战-案例篇文章目录前言一.什么是变量?二.变量分类2.1按照变量的作用分2.2按照变量的作用域分三.变量的定义与查看3.1环境变量3.2特殊变量3.3

(三十一)大数据实战——一键式DolphinScheduler高可用工作流任务调度系统部署安装

前言DolphinScheduler(DolphinScheduler)是一个分布式、易扩展的开源DAG(有向无环图)工作流任务调度系统,可用于构建大规模数据处理、数据仓库、ETL等复杂的数据处理和数据分析场景。DolphinScheduler支持多种任务类型,包括Shell、SQL、Spark、Python、Sub-

一文讲解Linux内核中的设计模式

在软件开发中,设计模式是一种被广泛应用的解决问题的方法。设计模式可以帮助开发人员有效地解决软件设计中的问题,提高软件的可维护性和可扩展性,同时也能提高代码的可读性和可重用性。而在Linux内核的开发中,设计模式也扮演了重要的角色。Linux内核作为一个开源操作系统内核,其内部架构复杂,代码庞大,设计模式在其中的应用也十

02-yaml资源文件

1、创建pod的基础文件创建pod的yaml文件详解---apiVersion:extensions/v1beta1#当前格式的版本kind:Deployment#当前创建资源的类型,当前类型是Deploymentmetadata:#当前资源的元数据name:test-os#当前资源的名字是元数据必须的项spec:#是

热文推荐