摘要
本发明涉及机器学习与电子函件管理技术领域,公开了机器学习驱动的电子函件附件智能分类方法及系统,该方法包括:获取电子函件附件原始数据流,经三级切片提取业务关键词,计算语义集中度指标,得到语义特征,映射至语义特征集合空间,生成语义指纹编码;建模识别算法得到三级区域,提取结构化特征集合,计算关联强度值构融合特征集合;提取上下文要素集合,计算总关联强度值,设置分层决策规则构建有向关联集合。解决电子函件附件分类中非结构化附件转化难、多模态理解不足、上下文关联弱、分类精准度低、查询效率低的问题。
技术关键词
机器学习驱动
智能分类方法
切片
语义特征
附件
集中度
场景
协作关系
文本
智能分类系统
表格
关系网络
关键词
指纹
强度
融合特征
编码
识别页面