摘要
本公开实施例公开了一种模型训练、数据构造方法、装置、电子设备和存储介质,通过将提示信息输入多个第一模型,使得每个第一模型推理得到一组输出信息,每组输出信息包括多个输出信息。进一步,对每个输出信息进行正向修改和负向修改,得到针对该提示信息的具有对比关系的多个回答信息,即根据同一输出信息得到的多个回答信息具有天然的质量优劣对比关系,从而无需进行人工排序即可获得具有优劣对比关系的偏好数据对,降低了偏好数据对的构造成本。
技术关键词
数据构造方法
关系
电子设备
模型训练装置
输入模块
模型训练方法
处理器
存储装置
可读存储介质
程序
文本
计算机
系统为您推荐了相关专利信息
供电电路
电压变换电路
显示驱动电路
电感
晶体管
异常事件
趋势预测模型
数据采集设备
检测设备
存储程序代码
储能设施
优化模型方法
分布式储能
作业场景
损耗