摘要
本发明公开了一种基于预训练语言模型的智能软件兼容性问题检测方法,收集无标签和带标签的Python堆栈跟踪数据,以构建预训练数据集和微调数据集;解析Traceback数据并统一格式;处理超过模型最大长度限制的Traceback数据;使用无标签Traceback数据在BERT模型基础上进行无监督再训练,学习Traceback语义特征;构建智能软件兼容性问题检测模型;划分微调数据集,选择训练集中的正例数据来构造类别平衡的微调训练集,使用少量带标签的数据集对分类模型进行微调。本发明解决了现有方法无法自动检测智能软件运行过程中出现的兼容性问题,克服了现有模型在理解Python Traceback上下文语义特征方面的局限,能够充分捕获堆栈帧和异常信息之间的依赖关系,有效提高了智能软件兼容性问题检测的准确率。
技术关键词
预训练语言模型
兼容性问题
异常信息
多头注意力机制
软件
标签
语义特征
分类模型训练
自定义算法
训练集
自定义规则
编码器
序列
样本
预训练模型
数据噪声
格式
系统为您推荐了相关专利信息
运维方法
LSTM模型
楼宇设备
数字孪生模型
剩余寿命预测
道路施工方法
压实技术
压实设备
地理信息系统软件
压实度
实体
非线性
机器可读介质
企业资源规划
ERP系统