摘要
本公开提供了评估大语言模型能力、对齐大语言模型的方法、相关装置及计算机程序产品,涉及大语言模型对齐、模型能力评估、深度学习等人工智能技术领域。评估大语言模型能力的方法的一具体实施方式包括:利用待评估大语言模型处理样本问题,得到至少两个待评估答案;利用与样本问题对应的样本答案,从至少两个待评估答案中确定出正确答案集合;响应于正确答案集合中包括至少两个正确答案,基于正确答案之间的相似度比较结果,生成第一能力评价值,基于正确答案集合中正确答案与待评估答案之间的数量关系,生成第二能力评价值;基于第一能力评价值和第二能力评价值,生成用于评估待评估大语言模型的模型能力的目标能力评价值。由此,能够更为全面、质量和效率地对大语言模型的模型能力进行评估。
技术关键词
大语言模型
答案
样本
策略
计算机程序产品
关系
人工智能技术
处理器通信
指令
可读存储介质
存储器
电子设备
编辑
系统为您推荐了相关专利信息
动态数据脱敏方法
脱敏规则
策略执行点
多用户
字段
人工智能引擎
调度优化方法
柔性工作流
多任务
图谱
考试阅卷
注意力模型
填涂模板
图片
智能信息识别
电力调度方法
道路通行时间
微电网
样本
注意力机制
变压器故障检测
BP神经网络
生成对抗网络
多分类器
数据生成模型