一种基于大模型的断言错误归因能力评估方法及系统

AITNT
正文
推荐专利
一种基于大模型的断言错误归因能力评估方法及系统
申请号:CN202511057537
申请日期:2025-07-30
公开号:CN120994544A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种基于大模型的断言错误归因能力评估方法及系统,包括:在真实缺陷报告中收集原始数据,构建包含多难度层级的混淆测试数据集;预定义三种测试场景,执行自动化测试过程,解析日志并记录每种场景下对应的测试报错信息:提取焦点方法代码的上下文信息,利用推理式大模型进行语义增强;将测试报错信息与经过语义增强的代码上下文信息进行整合,构造生成用于能力评估的输入提示词;大模型接受处理后,输出其对断言错误的推断结论;通过比对大语言模型输出的结果与预定义的标准答案之间的一致程度,计算出用于衡量大模型断言错误归因能力的核心评估指标。利用本发明,能够客观、准确地评估大模型在面对真实缺陷时的断言错误归因能力。
技术关键词
能力评估方法 归因 能力评估系统 测试场景 启发式规则 焦点 语义 解析日志 循环控制结构 大语言模型 条件判断语句 静态分析技术 逻辑 层级 指标 模块 核心 正确率
系统为您推荐了相关专利信息
1
一种基于多模感知与时空推理的海洋生态异常预警方法及系统
预警方法 生态 多模态特征 海洋 融合特征
2
基于工况数据的特种设备损伤智能监测方法、系统及介质
智能监测方法 孤立森林算法 工况 序列 深度生成模型
3
一种传感器数据的生成方法、装置、电子设备及存储介质
传感器 时间段 物理设备 长短期记忆网络 时序特征
4
一种注塑生产监测方法、装置及系统
监测方法 波形特征提取 材料特性参数 指纹数据库 高精度压力传感器
5
一种内核模糊测试配置相关种子的生成调度方法
代码覆盖率 系统调用序列 大语言模型 内核动态配置 种子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号