摘要
本公开涉及一种领域大语言模型微调训练方法、装置、电子设备及介质;方法包括:在微调训练阶段,获取多个领域任务的原始指令数据,构建单项选择任务数据集,单项选择任务数据集包括多个领域任务的多条单项选择任务数据,对单项选择任务数据集中的原始指令题目进行数据扰动操作,识别各个领域任务的关键注意力头,获取关键注意力头索引表,基于关键注意力头索引表,加载目标领域任务对应的目标关键注意力头列表;针对目标领域任务,基于目标关键注意力头列表进行关键注意力头训练,更新目标关键注意力头列表中各个关键注意力头的权重参数,冻结其他网络层的权重参数。
技术关键词
注意力
大语言模型
索引表
数据
列表
指令
参数更新模块
电子设备
训练装置
处理器
阶段
可读存储介质
关系
存储器
计算机
系统为您推荐了相关专利信息
固件更新方法
SM9算法
分区
计算机设备
固件更新装置
中药经典名方
智能推荐方法
知识图谱技术
节点
方剂
人机交互信息
距离标定
自动驾驶状态
自动识别方法
阶段