摘要
本发明公开了一种针对C语言编译器优化缺陷的根因分类方法,包括:步骤1、通过文献分析和数据观察的人工分析方法反复迭代构建初步的分类体系;步骤2、在构建数据集的同时通过数据验证的方法完善最终的分类体系;步骤3、使用生成式的数据增强方法扩充数据集,辅助提高分类器性能;步骤4、对数据进行适当的预处理,使用堆叠集成学习方法集成RTA和Llama3.1两种大语言模型实现自动化分类。本发明建立起一个系统化且有效的分类体系,并构建一个自动化的分类方法,有效地识别和预测C语言编译器中的优化缺陷根因,缩减缺陷修复的可疑范围,显著提高开发人员的修复效率,并促进了领域研究的深入发展。
技术关键词
集成学习方法
大语言模型
随机森林模型
数据验证
自动化分类方法
分类器
分层抽样方法
分析方法
报告
文本分类模型
自然语言
词向量模型
分析缺陷
机器学习模型
深度学习模型
预训练模型
训练集
修复方法
系统为您推荐了相关专利信息
风险评价系统
大语言模型
图像识别模块
空气监测设备
采集设备
笔迹图像
认知功能评估
大语言模型
图像处理模块
数据获取模块