摘要
本申请公开了一种用于大模型的评测方法及装置。所述评测方法包括:获取知识参考数据集,所述知识参考数据集包括常识知识参考数据集、世界知识参考数据集和语言知识参考数据集中的至少一者;基于所述知识参考数据集,构建未被包括在针对大型语言模型的训练语料库中的评测问题以及与评测问题对应的评测答案;针对每个评测问题的知识关系,构建多种问题模板,从而各个评测问题及其对应的评测答案以及多种问题模板构成用于大型语言模型的评测数据库;根据预设评测标准,利用所述评测数据库对待评测大型语言模型进行评测,得到所述待评测大型语言模型的评测结果。
技术关键词
评测方法
训练语料库
答案
数据
模板
评测装置
计算机程序产品
计算机可执行指令
计算机设备
关系
处理器
语义
时效性
模块
风格
格式
存储器
频率
系统为您推荐了相关专利信息
客流预测方法
粒子群优化算法
时间序列预测技术
注意力机制
多尺度滑动窗口
智控系统
风险
数据采集层
实时监测数据
智控方法
财务管理系统
迁移方法
建立映射关系
计算机程序产品
树形结构