摘要
本发明涉及一种基于密度隶属熵的过采样算法,融合局部密度和模糊隶属度构建隶属熵模型,划分样本空间为安全区域和重叠区域:安全区域以少数类样本为中心,搜索到最近多数类样本的距离,基于局部加权不平衡系数和动态扩展因子,在自适应圆形采样区域内均匀随机采样;重叠区域沿少数类与最近多数类样本的连线线性插值,通过高斯混合采样引入方向离散扰动,耦合样本权重与高斯混合系数,优先生成可靠样本;基于加权编辑最近邻和相对数据密度清洗样本,抑制冗余性。本方法保障安全区域样本几何合理性,增强重叠区域分布多样性,精确刻画数据集原始流形结构,提升类别均衡性与模型泛化性能。
技术关键词
密度
模糊隶属度
混合高斯模型
噪声样本
算法
数据分布
精确地识别
K近邻法
距离估计
因子
编辑
决策
连线
分类器
策略
参数
非线性
系统为您推荐了相关专利信息
图像处理系统
信号传输单元
信号收发模块
数据采集单元
图像识别模块
动态滑模控制
矢量控制方法
SVPWM控制方法
SVPWM控制算法
数学模型
氢气燃烧器
采集单元
太阳能热水器
温度控制系统
中央处理器
LDPC码译码器
移位寄存器单元
校验矩阵
数据选择器
后验概率
管理中心
数字化管理方法
通信网络接口
网络管理软件
管理信息数据库