大语言模型的指令微调方法、装置、设备及介质

正文

推荐专利

申请号：CN202411751046

申请日期：2024-11-29

公开号：CN119670914A

公开日期：2025-03-21

类型：发明专利

摘要

本发明涉及人工智能开发技术领域，尤其涉及一种大语言模型的指令微调方法、装置、设备及介质，可应用于AI医生家庭问诊模型的训练，该大语言模型的指令微调方法包括，获取初始数据集；从初始数据集中选取符合预设偏好的样本数据，以构建偏好数据集；将初始数据集划分为多个微调数据集；根据多个微调数据集，对预训练大语言模型进行分批次微调，每经过预设数量批次的微调后，从偏好数据集中获取预设数量的偏好样本数据，将偏好样本数据插入下个批次的微调数据集中。通过在指令微调阶段使用偏好样本数据对大语言模型进行训练，令得到的大语言模型的输出能够准确对齐偏好，同时省略了强化学习对齐步骤，降低了训练大语言模型时的资源消耗。

技术关键词

大语言模型微调方法数据样本人工智能开发技术指令可读存储介质微调装置处理器计算机设备模块存储器标记基础参数家庭阶段资源

系统为您推荐了相关专利信息

城市级停车需求规模预测方法、系统、电子设备及介质

规模预测方法记忆单元变量多头注意力机制多源融合

电机转动惯量辨识方法及装置

电机转动惯量计算机可执行指令非瞬时性计算机可读存储介质特征值幅值

储能充放电管理方法、系统、设备及存储介质

充放电管理方法充放电次数长短期记忆网络气象变量

一种基于相关熵的事件触发递归模糊神经网络多变量控制方法

递归模糊神经网络优化模糊神经网络多变量控制方法李雅普诺夫函数溶解氧

一种基于YOLOv5s的多模态特征融合苹果识别方法

苹果识别方法 Laplacian算子多模态特征融合深度学习训练果实

大语言模型的指令微调方法、装置、设备及介质

站点导航

APP 下载