摘要
本发明提供一种标注数据检验方法、装置、设备、介质及计算机程序产品,所述方法包括:基于历史查询数据和历史标注数据构建训练数据;将基于所述训练数据生成的提示指令输入待训练的奖励模型,得到所述奖励模型输出的奖励标量;基于标量损失训练所述奖励模型;所述标量损失是基于所述奖励标量确定的;将用户查询数据和待检验预标注数据输入训练好的奖励模型,得到预标注检验结果。本发明通过训练奖励模型,对待检验的预标注数据进行快速检验,降低了人工检验的工作量,提高了标注数据的检验效率。
技术关键词
数据检验方法
计算机程序产品
指令
三元组
模型训练模块
处理器
检验装置
存储器
线性
电子设备
介质
工作量
关系
系统为您推荐了相关专利信息
雷达回波数据
三元组
知识图谱构建方法
节点
数据处理模块
深度学习模型
天线设计方法
网络
计算机程序指令
训练样本集
头皮脑电
P300成分
神经网络模型
分析事件
数据
社区发现方法
网络节点数量
社区发现算法
Louvain算法
计算机可读指令