摘要
本发明涉及信息处理技术领域,公开了一种智能化多模态信息识别与分类管理系统及方法,其技术方案要点是多模态嵌入模块用于生成文档的丰富语义表示;预处理模块用于将文档转换为与这些模型兼容的图像格式;标记已知文档模块对于已知类别的一组带标签的文档;分类模块使用向量相似性度量,将新的、未见过的文档的嵌入与这些预先计算的类嵌入进行比较,以确定最相似的类;压缩模块通过压缩柱状文件格式存储类嵌入和标记的多模式嵌入空间。利用预先训练的多维度来弥补这一差距以计算高效且有效的方式构建模态嵌入模型,从而实现多模态文档的准确分类。
技术关键词
分类管理系统
多模态信息
生成文档
标记
分类管理方法
模块
度量
带标签
信息处理技术
页面
文档分类
语义特征
多模式
柱状
代表
元素