摘要
本发明公开了一种基于大模型的断言错误归因能力评估方法及系统,包括:在真实缺陷报告中收集原始数据,构建包含多难度层级的混淆测试数据集;预定义三种测试场景,执行自动化测试过程,解析日志并记录每种场景下对应的测试报错信息:提取焦点方法代码的上下文信息,利用推理式大模型进行语义增强;将测试报错信息与经过语义增强的代码上下文信息进行整合,构造生成用于能力评估的输入提示词;大模型接受处理后,输出其对断言错误的推断结论;通过比对大语言模型输出的结果与预定义的标准答案之间的一致程度,计算出用于衡量大模型断言错误归因能力的核心评估指标。利用本发明,能够客观、准确地评估大模型在面对真实缺陷时的断言错误归因能力。
技术关键词
能力评估方法
归因
能力评估系统
测试场景
启发式规则
焦点
语义
解析日志
循环控制结构
大语言模型
条件判断语句
静态分析技术
逻辑
层级
指标
模块
核心
正确率
系统为您推荐了相关专利信息
智能监测方法
孤立森林算法
工况
序列
深度生成模型
传感器
时间段
物理设备
长短期记忆网络
时序特征
监测方法
波形特征提取
材料特性参数
指纹数据库
高精度压力传感器
代码覆盖率
系统调用序列
大语言模型
内核动态配置
种子