摘要
本申请公开了一种医疗问答大模型微调方法、装置、设备及存储介质,涉及计算机技术领域,包括:获取基于基础大语言模型构建的初始医疗问答大模型,基于预设提示词指令数据集对初始医疗问答大模型进行监督微调;基于监督微调后的医疗问答大模型、预设筛选规则及预先训练好的目标模型对预设提示词指令数据集中的样本数据对进行筛选;基于样本筛选结果确定目标偏好训练数据集,利用目标偏好训练数据集对监督微调后的医疗问答大模型进行再次微调,得到微调后的目标医疗问答大模型,以便基于目标医疗问答大模型对用户端发起的医疗相关问题进行响应。本申请能够优先提高偏好数据的构建效率与质量,并简化模型对齐的训练流程与提高稳定性。
技术关键词
微调方法
样本
大语言模型
指令
微调装置
基础
数据格式
可读存储介质
模块
处理器
电子设备
存储器
计算机
算法
参数
系统为您推荐了相关专利信息
深度强化学习算法
网络
训练智能体
智能体模型
强化学习模型
可靠性分析方法
Kriging模型
代表
样本
主成分分析法
影像检测设备
成分分析仪
炉膛
FTIR技术
数据