摘要
本发明公开一种基于混合专家结构的问答任务评估方法及系统,属于人工智能领域,所述方法包括:获取待测大语言模型针对一问题产生的回复,并结合所述问题从该回复中抽取出简短答案;根据预定义匹配规则获取该简短答案与该问题的真实答案之间的匹配结果;在所述匹配结果为完全匹配或者部分匹配且预测答案无超出与错误的情况下,基于预定义匹配规则的评分设定,赋予该回复一评估得分;在所述匹配结果为完全不匹配或者存在错误的情况下,使用一基于混合专家结构的评估模型来生成该回复的评估得分。本发明在保证对回复评估的高准确率同时,具备较高的成本效益。
技术关键词
答案
计算机程序指令
负载均衡优化
分类网络
计算机程序产品
计算机设备
可读存储介质
样本
大语言模型
曲线斜率
评估系统
电子设备
处理器
周期
数据
动态
模块
参数
系统为您推荐了相关专利信息
桥梁路面
智能问答系统
桥梁模型
气流控制系统
问答匹配模型
图像
场景分类
视频
计算机程序指令
语义特征模型
惯性导航数据
计算机执行指令
基站
定位方法
陀螺仪数据
数据库查询优化
依赖特征
排序模型
计划
节点特征
网络通信数据
数据分析模型
异常用户
分布式数据采集
数据安全