摘要
本发明公开了一种开源项目中issues关联预测和关联类型分类方法,包括:issues关联预测阶段从开源项目历史数据中收集数据构建样本集,并提取结构化特征用于训练二元分类预测模型;issues关联类型分类阶段从收集的数据中构建并提取图特征并结合文本特征训练多分类模型,用于预测在上一个模块中被预测为存在关联的issues对的具体关联类型。本发明将issues之间关联关系的预测分为关联预测和关联类型分类两个阶段,通过挖掘issues之间的深层语义特征和图结构特征结合结构化特征实现关联issues的预测和关联关系的分类,用于提高关联issues推荐的准确性。
技术关键词
开源项目
多分类器
阶段
文本
样本
语义特征
分类方法
分类预测模型
训练分类器
嵌入框架
机器学习算法
数据
神经网络模型
页面
生态系统
自然语言
无监督
关系
系统为您推荐了相关专利信息
算法模型
精度评估方法
样本
计算机可读指令
精度评估装置