大模型评估方法、装置、设备、系统及程序产品

正文

推荐专利

申请号：CN202510042948

申请日期：2025-01-10

公开号：CN120106210A

公开日期：2025-06-06

类型：发明专利

摘要

本实施例提供了一种大模型评估方法，该方法通过获取通过目标大模型问答所得的对话数据；然后基于问答对话之间的跟随关系依次对问答对话进行指令抽取得到对话指令，并对对话指令进行打分得到第一得分；并提取问答对话对应的答案信息，并将答案信息与前序答案信息进行比对得到第二得分；且对答案信息进行回复质量评价，以得到第三得分；进而结合第一得分、第二得分以及第三得分得到目标得分，以通过目标得分对目标大模型进行评估。从而实现多维度的评估过程，由于针对多轮次对话的特点进行多维度的指标配置，实现了自动化评估，可以大幅降低人工的参与度，减少因个人主观看法造成的偏差，提高大模型评估的准确性。

技术关键词

答案模型评估方法指令层次结构模型文本服务端数据语义向量客户端评估设备计算机程序产品评估装置评估系统序列关系处理器逻辑元素线性偏差

系统为您推荐了相关专利信息

单路可调OLED恒流驱动器及OLED恒流驱动方法

电流数模转换单元电源芯片控制组件驱动器

一种数据压缩方法、电子设备、介质及产品

车辆终端压缩算法数据压缩方法期望传输速率参数

差异化并发业务跨域通信方法及装置

跨域通信方法数学模型变量时延业务分配

基于数据驱动的虚拟电厂电力交易优化方法及系统

交易优化方法电力存储设备波动特征多元回归分析曲线特征

基于查询意图识别的数据库索引推荐方法、设备及介质

索引推荐方法抽象语法树查询意图性能指标数据文本

大模型评估方法、装置、设备、系统及程序产品

站点导航

APP 下载