摘要
本公开的实施例提供了用于响应评估的方法、装置、设备、存储介质和程序产品。该方法包括:获取第一样本查询、针对所述第一样本查询的第一预测响应以及第一真值响应,所述第一真值响应与所述第一样本查询相对应;以及利用经训练的奖励模型,基于第一样本查询、第一预测响应和第一真值响应,确定针对第一预测响应的奖励得分,奖励得分指示针对样本查询,第一预测响应是否优于第一真值响应。以此方式,可以提高被确定的奖励得分的准确性。
技术关键词
问答模型
样本
模版
处理器
计算机程序产品
可读存储介质
存储器
电子设备
指令
模块
策略
标签
系统为您推荐了相关专利信息
参数
机器学习模型
硬件加速器
数据处理方法
误差
管理考核方法
层次结构模型
指标
层次分析法
水库