基于LoRA的注意力对齐微调方法、装置、设备及介质

正文

推荐专利

申请号：CN202411528782

申请日期：2024-10-30

公开号：CN119398103A

公开日期：2025-02-07

类型：发明专利

摘要

本申请涉及人工智能及深度学习技术领域，提出了一种基于LoRA的注意力对齐微调方法、装置、设备及介质，该方法包括：获取已训练的初始预训练模型；冻结所述初始预训练模型的参数，并在所述预训练模型的每层设置LoRA模型，得到中间预训练模型；在所述中间预训练模型上加入注意力机制，得到最终预训练模型，其中，所述注意力机制的参数可训练；获取第一数据集，并使用所述第一数据集对所述最终预训练模型进行微调，得到微调后的目标模型。通过本申请的技术方案，加快卷积神经网络的微调速度，不增加推理时的计算量，微调时训练参数少，占用GPU内存少，训练速度加快。

技术关键词

预训练模型注意力机制微调方法矩阵计算机可执行指令数据参数深度学习技术微调装置通道处理器通信计算机设备代表可读存储介质模块存储器分块

系统为您推荐了相关专利信息

基于数据和有限元模型的镗床诊断方法及装置

故障诊断模型镗床诊断方法通道注意力机制训练神经网络模型

一种基于年际增量的月际或季节尺度降水预测方法

因子降水预测方法奇异值分解方法经验正交函数线性回归方法

一种预测lncRNA与疾病关联的方法

多头注意力机制疾病异构网络构建网络结构信息节点特征

一种基于拉曼光谱检测的结直肠癌早期诊断模型构建方法

早期诊断模型构建方法动态拉曼光谱直肠癌腺嘌呤时序特征

一种基于图像数据的SMT焊点缺陷检测方法

焊点缺陷检测方法轮廓模型区域生长算法图像曲率特征

基于LoRA的注意力对齐微调方法、装置、设备及介质

站点导航

APP 下载