Adalora使用教程

【代码】Adalora使用教程。

wenjurongyu

482人浏览 · 2024-08-12 16:58:33

wenjurongyu · 2024-08-12 16:58:33 发布

Adalora使用教程

# 安装loralib pip
# pip install loralib
import loralib
# adalora使用的是svd伪装。
layer = loralib.SVDlLinear(in_feature, outfeature, r=12)

# 加载大模型
model = BigModel()
# fix大模型参数
loralib.mark_only_lora_as_trainable(model)

# RankAllocator就是所谓的r的训练scheduler，也就是最开始r先大一点，后面就是将mask住sensitivity score小的，然后开始彻底maks住。
from loralib import RankAllocator
from loralib import compute_orth_regu

# 设置RankAllocator
# init_warmup：最开始不动
# 删除但是恢复
# final_warmp:最后删除不恢复
# beta1 :i =  beta1 * i + (1 - beta1) * (sensitivity_score(wij))
# beta2 :u =  beta2 * u + (1 - beta2) * (sensitivity_score(wij) - i)
rankallocator = RankAllocator(model, lora_r=12, target_rank=8, init_warmup=500,final_warmup=1500,
                             mask_interval=10, total_step=3000, beta1=0.85, beta2=0.85)


# 让伪svd分解师正交矩阵,加上一个正交惩罚项
(loss + compute_orth_regu(model,regu_weight=0.1)).batckward()
optimizer.step()

# 将svd部分的奇异值进行mask
randallocator.update_and_mask(model, global_step)
glob_step += 1

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

多模态大模型的发展历程

2048 AI社区

基于CubeMx的STM32开启DMA空闲中断进行串口不定长收发

在main.c// 接收数据缓冲区，大小按需求自定义即可优势：CPU占用率低（DMA搬运数据），实时性强（中断响应帧结束）。应用场景：适用于物联网设备、工业控制等需处理可变长度数据的系统。扩展建议：添加帧头/帧尾校验提升鲁棒性，或结合RTOS实现多任务处理。

2048 AI社区

拉林科纳达：安第斯山脉上的黄金小镇

中文：拉林科纳达是安第斯山脉上因黄金而生的特殊城镇，以 “世界最高永久居住地” 的地理标签与单一矿业经济为核心特征。它保留了原始的安第斯印第安文化，却因极端环境与资源依赖面临贫困、安全、环境等多重挑战。作为秘鲁经济链条中的微小节点，它无国际影响力，仅通过黄金贸易与全球市场间接关联。对于环球旅行者而言，它并非传统旅游目的地，却因独特的高原矿业生态，成为观察极端环境下人类生存状态的小众样本。（注：文档