评估大语言模型能力、对齐大语言模型的方法、相关装置及计算机程序产品

正文

推荐专利

申请号：CN202510736388

申请日期：2025-06-04

公开号：CN120579577A

公开日期：2025-09-02

类型：发明专利

摘要

本公开提供了评估大语言模型能力、对齐大语言模型的方法、相关装置及计算机程序产品，涉及大语言模型对齐、模型能力评估、深度学习等人工智能技术领域。评估大语言模型能力的方法的一具体实施方式包括：利用待评估大语言模型处理样本问题，得到至少两个待评估答案；利用与样本问题对应的样本答案，从至少两个待评估答案中确定出正确答案集合；响应于正确答案集合中包括至少两个正确答案，基于正确答案之间的相似度比较结果，生成第一能力评价值，基于正确答案集合中正确答案与待评估答案之间的数量关系，生成第二能力评价值；基于第一能力评价值和第二能力评价值，生成用于评估待评估大语言模型的模型能力的目标能力评价值。由此，能够更为全面、质量和效率地对大语言模型的模型能力进行评估。

技术关键词

大语言模型答案样本策略计算机程序产品关系人工智能技术处理器通信指令可读存储介质存储器电子设备编辑

系统为您推荐了相关专利信息

一种动态数据脱敏方法、装置、电子设备及计算机存储介质

动态数据脱敏方法脱敏规则策略执行点多用户字段

基于AI智能策略生成的多任务印刷调度优化方法

人工智能引擎调度优化方法柔性工作流多任务图谱

基于人工智能和GAT的考试阅卷答题卡填涂识别方法

考试阅卷注意力模型填涂模板图片智能信息识别

一种电动汽车参与的电力调度方法

电力调度方法道路通行时间微电网样本注意力机制

一种变压器故障检测方法、装置、设备及介质

变压器故障检测 BP神经网络生成对抗网络多分类器数据生成模型

评估大语言模型能力、对齐大语言模型的方法、相关装置及计算机程序产品

站点导航

APP 下载