摘要
本发明涉及建立双重约束的半监督分类方法,属于计算机与信息科学技术领域。本发明首先使用自编码器对数据编码;其次利用K‑means算法对编码数据聚类,将聚类结果的簇中心作为初始分类中心,并根据各类别数量比例构建类大小约束;然后利用模糊C‑means算法对编码数据聚类得到隶属度矩阵,计算样本属于边界样本的概率,根据概率值对标注样本降序排列,依次选取序列两端的样本构建成对约束;最后将上述两种约束引入损失函数中,指导自编码器训练得到分类模型。本发明针对现有方法随机初始化分类中心易产生空类,以及随机构建成对约束易使边界样本误分类的问题,通过类大小约束避免空类,同时利用成对约束降低边界样本误分类的概率,提高分类准确率。
技术关键词
监督分类方法
样本
初始聚类中心
编码器训练
少量标注数据
信息科学技术
算法
数据编码
分类准确率
序列
矩阵
种子
计算机
标签
系统为您推荐了相关专利信息
图像处理模型
蒸馏方法
样本
数据
计算机可执行指令
分级评价方法
指标
决策树模型
信息熵
构建决策树