摘要
本发明公开了一种模型训练方法、装置、电子设备以及存储介质,本方法包括:基于预先设置的情感训练数据,对自然语言模型进行第一指令监督微调训练,得到第一中间模型;基于预先设置的专业训练数据,对所述第一中间模型进行第二指令监督微调训练,得到第二中间模型;基于预先设置的日常对话训练数据,对所述第二中间模型进行直接偏好优化训练,得到目标模型。本发明可以实现自然语言模型的自然、专业以及安全的会话交互,提升自然语言模型的情感表达能力。
技术关键词
模型训练方法
自然语言模型
数据
样本
模型训练装置
计算机可执行指令
对话方法
电子设备
多轮对话
处理器
存储器
单轮
模块
飞轮
专业
场景
程序
系统为您推荐了相关专利信息
多模态
语音情感识别技术
访问权限分级
生物
加密认证算法
设备故障定位
设备老化
历史运行数据
马尔可夫模型
预警方法
城市物联网管理系统
决策
分布式文件系统
实时数据
计算机可执行指令
识别训练方法
穴位图谱
下肢
压力板
计算机程序指令
建筑设备
建筑信息模型
设备控制
序列
设备全生命周期