摘要
本申请涉及一种大模型推理评估方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:获取待测模型根据目标测试问题输出的答案;答案包括思维链和推理答案;对思维链进行多维度语义评估,得到第一评估得分;对思维链和推理答案进行规则验证,得到第二评估得分;基于第一评估得分以及第二评估得分,得到答案的评估结果。采用本方法能够提高大模型推理的评估结果的准确性和全面性。
技术关键词
答案
测试用例库
标记
逻辑
语义
计算机设备
术语
计算机程序产品
可读存储介质
距离检测
处理器
评估装置
标签
关系
模块
关键词
存储器
数据
标识
系统为您推荐了相关专利信息
处理器
任务调度
可扩展标记语言XML文件
队列
电子设备
钢板坡口
三维点云数据
训练深度学习模型
随机森林
分析方法