摘要
本发明公开了一种基于深度学习的制造业图文混合文档自动分类与定密方法,包括S1、获取图文混合文档;S2、对图文混合文档中的文本部分进行预处理;S3、生成文本特征向量;S4、对文档中的图像部分进行预处理;S5、生成图像特征向量;S6、生成综合特征向量;S7、利用自适应层级分类模型对综合特征向量进行分类分析,将图文混合文档分类到预先定义的类别中;S8、对分类后的文档进行敏感信息识别;S9、利用识别出的敏感信息,通过基于动态风险评估的保密等级判定模型自动判定文档的保密等级;S10、输出分类和定密结果,并将结果存储到文档管理系统中。本发明显著提升了图文混合文档的自动分类和保密等级判定的效率和准确性。
技术关键词
文本特征向量
图像特征向量
图文
敏感信息识别
动态卷积神经网络
文档管理系统
分类器
关键字
语义特征
层级
序列
词语
文档分类
格式化
注意力
矩阵
高层次