一种基于大模型的断言错误归因能力评估方法及系统

正文

推荐专利

申请号：CN202511057537

申请日期：2025-07-30

公开号：CN120994544A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种基于大模型的断言错误归因能力评估方法及系统，包括：在真实缺陷报告中收集原始数据，构建包含多难度层级的混淆测试数据集；预定义三种测试场景，执行自动化测试过程，解析日志并记录每种场景下对应的测试报错信息：提取焦点方法代码的上下文信息，利用推理式大模型进行语义增强；将测试报错信息与经过语义增强的代码上下文信息进行整合，构造生成用于能力评估的输入提示词；大模型接受处理后，输出其对断言错误的推断结论；通过比对大语言模型输出的结果与预定义的标准答案之间的一致程度，计算出用于衡量大模型断言错误归因能力的核心评估指标。利用本发明，能够客观、准确地评估大模型在面对真实缺陷时的断言错误归因能力。

技术关键词

能力评估方法归因能力评估系统测试场景启发式规则焦点语义解析日志循环控制结构大语言模型条件判断语句静态分析技术逻辑层级指标模块核心正确率

系统为您推荐了相关专利信息

一种基于多模感知与时空推理的海洋生态异常预警方法及系统

预警方法生态多模态特征海洋融合特征

基于工况数据的特种设备损伤智能监测方法、系统及介质

智能监测方法孤立森林算法工况序列深度生成模型

一种传感器数据的生成方法、装置、电子设备及存储介质

传感器时间段物理设备长短期记忆网络时序特征

一种注塑生产监测方法、装置及系统

监测方法波形特征提取材料特性参数指纹数据库高精度压力传感器

一种内核模糊测试配置相关种子的生成调度方法

代码覆盖率系统调用序列大语言模型内核动态配置种子

一种基于大模型的断言错误归因能力评估方法及系统

站点导航

APP 下载