摘要
本申请实施例公开了一种数据处理方法、装置、设备以及计算机可读存储介质,该方法包括:获取包括样本问题、至少两个样本答案以及偏好标签的训练样本;将至少两个样本答案分别确定为样本问题的样本标签,根据样本问题以及至少两个样本标签,生成至少两个监督训练样本;根据至少两个监督训练样本,对初始问答模型中的参数进行调整,得到第一问答模型;将训练样本输入至第一问答模型,在第一问答模型中,生成至少两个样本答案分别对应的第一预测概率;根据偏好标签以及至少两个第一预测概率,对第一问答模型中的参数进行调整,得到第二问答模型。采用本申请,可以提高模型训练稳定性以及生成多样性。
技术关键词
问答模型
样本
答案
标签
风险
数据处理方法
可读存储介质
计算机设备
计算机程序产品
参数
处理器
数据通信功能
网络接口
存储计算机程序
数据处理装置
存储器
关系
模块
强度
系统为您推荐了相关专利信息
图像分类方法
训练样本集
机器学习分类器
多级分类器
图像分类模型训练
卷积神经网络提取
预警方法
预警模型
数据编码
时序特征