摘要
本发明涉及基于级联聚类高维多模态特征选择的邮件分类方法,与现有技术相比解决了邮件分类技术中在高维特征情况下无法找到多个等效特征子集实现准确邮件分类的缺陷。本发明包括以下步骤:邮件数据的预处理及数据集的构建;根据邮件数据中的特征数量使用拉丁超立方采样方法初始化种群;更新每个子种群指导向量;完成解的评价;对每个子种群执行环境选择;多子种群的划分;进行子种群的调整;等效特征子集的记录与邮件的分类。本发明能够找到多个等效特征子集,为决策者提供更多的选择空间,实现邮件的准确分类。
技术关键词
多模态特征选择
邮件分类方法
拉丁超立方采样
聚类
级联
词语
邮件分类技术
数据
文本
错误率
元素
分词
规模
决策
代表
纠正错误
变量
标签
频率
系统为您推荐了相关专利信息
资产数据管理方法
数据标签
数据分类模型
聚类特征
构建机器学习模型
数字低通滤波器
BiLSTM模型
级联
序列
包络
智能软件系统
转移概率矩阵
模式
自动调优方法
动态
任务调度方法
节点
特征选择算法
分层聚类算法
数据
语义解析方法
笔画特征
条件随机场算法
区域生长算法
校正