摘要
本发明提供一种基于代码实体属性相似度的类不平衡处理方法及系统,涉及软件工程技术领域,方法包括:获取样本实例;提取所述样本实例中的多个正样本以及多个负样本,所述正样本的数量少于所述负样本的数量;提取各个所述正样本的依赖关系集合、历史变更集合以及代码文本;根据所述依赖关系集合、所述历史变更集合以及所述代码文本,计算各个所述正样本之间的依赖关系相似度、历史变更相似度以及代码文本相似度;对所述依赖关系相似度、所述历史变更相似度以及所述代码文本相似度进行加权融合,确定各个所述正样本之间的综合相似度;根据所述综合相似度,确定各个所述正样本的相似样本;将各个所述正样本与对应的相似样本进行合成,生成正样本。
技术关键词
样本
文本
实体
关系
软件工程技术
进化算法
指数
存储器
处理器
参数
系统为您推荐了相关专利信息
机器可读介质
处理器
样本
并行训练神经网络
数据
电网调度数据
知识库构建方法
数据标签
深度学习训练
实体
乳腺癌术后放射治疗
16SrRNA基因
高通量测序法
分型标志物
评估乳腺癌