摘要
本发明提供一种偏多标签特征选择方法、装置、设备和介质,涉及数据预处理技术领域。方法包含S1、获取偏多标签的原始训练数据集,并根据原始训练数据集,初始化标签置信度矩阵,以及构建标签的分布区域。S2、根据近邻的分布,更新标签置信度矩阵,对不可信标签的分布区域进行消歧,以及对不确定标签的分布区域进行迭代更新,直至达到最大迭代次数,获取消歧后的标签。S3、根据消歧后的标签,结合粒度计算与图论,将标签从细粒度聚合到粗粒度,并构造虚拟粗粒度标签。S4、根据虚拟粗粒度标签,结合从样本数据中获取的多个特征,构建适用于偏多标记数据的邻域粗糙集模型,并采用前向贪婪搜索算法选择重要性最高的特征。
技术关键词
特征选择方法
样本
矩阵
邻域粗糙集
搜索算法
Prim算法
生成树
噪声标签
定义标签
特征选择设备
数据预处理技术
特征选择装置
可读存储介质
元素
顶点
定义特征
参数
决策系统
系统为您推荐了相关专利信息
感兴趣区域图像
药片
语义分割模型
像素点
深度学习语义分割
像素矩阵
配置图像传感器
印刷产品
匹配器
印刷模板
电力传输路径
负荷特征
地貌特征
变电站选址方法
Sigmoid函数