摘要
本发明涉及人工智能开发技术领域,尤其涉及一种大语言模型的指令微调方法、装置、设备及介质,可应用于AI医生家庭问诊模型的训练,该大语言模型的指令微调方法包括,获取初始数据集;从初始数据集中选取符合预设偏好的样本数据,以构建偏好数据集;将初始数据集划分为多个微调数据集;根据多个微调数据集,对预训练大语言模型进行分批次微调,每经过预设数量批次的微调后,从偏好数据集中获取预设数量的偏好样本数据,将偏好样本数据插入下个批次的微调数据集中。通过在指令微调阶段使用偏好样本数据对大语言模型进行训练,令得到的大语言模型的输出能够准确对齐偏好,同时省略了强化学习对齐步骤,降低了训练大语言模型时的资源消耗。
技术关键词
大语言模型
微调方法
数据
样本
人工智能开发技术
指令
可读存储介质
微调装置
处理器
计算机设备
模块
存储器
标记
基础
参数
家庭
阶段
资源
系统为您推荐了相关专利信息
规模预测方法
记忆单元
变量
多头注意力机制
多源融合
电机转动惯量
计算机可执行指令
非瞬时性计算机可读存储介质
特征值
幅值
充放电管理方法
充放电次数
长短期记忆网络
气象
变量
递归模糊神经网络
优化模糊神经网络
多变量控制方法
李雅普诺夫函数
溶解氧
苹果识别方法
Laplacian算子
多模态特征融合
深度学习训练
果实