领域大语言模型微调训练方法、装置、电子设备及介质

AITNT
正文
推荐专利
领域大语言模型微调训练方法、装置、电子设备及介质
申请号:CN202411627791
申请日期:2024-11-14
公开号:CN119538981A
公开日期:2025-02-28
类型:发明专利
摘要
本公开涉及一种领域大语言模型微调训练方法、装置、电子设备及介质;方法包括:在微调训练阶段,获取多个领域任务的原始指令数据,构建单项选择任务数据集,单项选择任务数据集包括多个领域任务的多条单项选择任务数据,对单项选择任务数据集中的原始指令题目进行数据扰动操作,识别各个领域任务的关键注意力头,获取关键注意力头索引表,基于关键注意力头索引表,加载目标领域任务对应的目标关键注意力头列表;针对目标领域任务,基于目标关键注意力头列表进行关键注意力头训练,更新目标关键注意力头列表中各个关键注意力头的权重参数,冻结其他网络层的权重参数。
技术关键词
注意力 大语言模型 索引表 数据 列表 指令 参数更新模块 电子设备 训练装置 处理器 阶段 可读存储介质 关系 存储器 计算机
系统为您推荐了相关专利信息
1
UKEY的固件更新方法、装置、计算机设备及存储介质
固件更新方法 SM9算法 分区 计算机设备 固件更新装置
2
脊柱疾病诊断用多模态大语言模型的评测方法及系统
大语言模型 评测方法 基准 多模态 定位问题
3
一种基于知识图谱技术的中药经典名方智能推荐方法
中药经典名方 智能推荐方法 知识图谱技术 节点 方剂
4
一种基于代码简化的软件漏洞评估优化方法
评估优化方法 语句 程序切片 对源代码 关键词
5
一种基于QAR数据的直飞自动识别方法
人机交互信息 距离标定 自动驾驶状态 自动识别方法 阶段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号