大语言模型的指令微调方法、装置、设备及介质

AITNT
正文
推荐专利
大语言模型的指令微调方法、装置、设备及介质
申请号:CN202411751046
申请日期:2024-11-29
公开号:CN119670914A
公开日期:2025-03-21
类型:发明专利
摘要
本发明涉及人工智能开发技术领域,尤其涉及一种大语言模型的指令微调方法、装置、设备及介质,可应用于AI医生家庭问诊模型的训练,该大语言模型的指令微调方法包括,获取初始数据集;从初始数据集中选取符合预设偏好的样本数据,以构建偏好数据集;将初始数据集划分为多个微调数据集;根据多个微调数据集,对预训练大语言模型进行分批次微调,每经过预设数量批次的微调后,从偏好数据集中获取预设数量的偏好样本数据,将偏好样本数据插入下个批次的微调数据集中。通过在指令微调阶段使用偏好样本数据对大语言模型进行训练,令得到的大语言模型的输出能够准确对齐偏好,同时省略了强化学习对齐步骤,降低了训练大语言模型时的资源消耗。
技术关键词
大语言模型 微调方法 数据 样本 人工智能开发技术 指令 可读存储介质 微调装置 处理器 计算机设备 模块 存储器 标记 基础 参数 家庭 阶段 资源
系统为您推荐了相关专利信息
1
城市级停车需求规模预测方法、系统、电子设备及介质
规模预测方法 记忆单元 变量 多头注意力机制 多源融合
2
电机转动惯量辨识方法及装置
电机转动惯量 计算机可执行指令 非瞬时性计算机可读存储介质 特征值 幅值
3
储能充放电管理方法、系统、设备及存储介质
充放电管理方法 充放电次数 长短期记忆网络 气象 变量
4
一种基于相关熵的事件触发递归模糊神经网络多变量控制方法
递归模糊神经网络 优化模糊神经网络 多变量控制方法 李雅普诺夫函数 溶解氧
5
一种基于YOLOv5s的多模态特征融合苹果识别方法
苹果识别方法 Laplacian算子 多模态特征融合 深度学习训练 果实
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号