摘要
本发明公开了一种基于预训练模型的软件项目缺陷预测方法及系统。本发明通过代码表征预训练语言模型和多模态数据,可以提高模型对不同项目的适应性和泛化能力,并且可以获取代码的高质量语义和语法特征。通过条件生成对抗网络预训练生成器实现多重数据增强,使得半监督生成对抗网络的生成器能够根据特定缺陷类别比例构造训练数据。通过半监督生成对抗网络利用有标签数据和无标签数据进行训练,可以缩小不同项目之间的数据分布差异,提高模型泛化能力。最后通过保存不同训练阶段的组合权重文件实现集成学习,在预测时可以综合多个模型状态降低模型的方差,提高预测结果的稳定性和可靠性。
技术关键词
预训练语言模型
缺陷预测方法
条件对抗生成网络
预训练模型
缺陷类别
项目
自然语言文本
半监督生成对抗网络
软件
标签
条件生成对抗网络
缺陷预测系统
过采样技术
前馈神经网络
语法特征
数据处理模块
注意力机制
系统为您推荐了相关专利信息
跨模态
识别方法
视频时空特征
空间变换网络
教师
病虫害
卷积神经网络模型
对比度
智能识别方法
预训练模型
主题识别方法
识别系统
主题聚类算法
多模态数据融合
语义向量
生成警报信号
机器学习模型
动态
智能优化调度方法
数据分析模块