摘要
本发明涉及多模态文本解析技术领域,具体涉及多模态文本智能解析系统。该系统包括:本发明提取多模态文本的文本特征和图像特征,将文本特征和图像特征进行矩阵坐标变换,并进行降维处理得到分解向量,计算分解向量的空间距离D,基于空间距离D判断文本特征和图像特征是否满足多模态嵌入语义表示提取要求,得到视觉嵌入式语义表示和文本嵌入式语义表示;对视觉嵌入式语义表示和文本嵌入式语义表示进行聚类处理得到若干个语义表示对,并将语义表示对进行对齐融合处理,得到融合语义表示,对融合语义表示通过图卷积神经网络进行学习,得到学习结果,能够通过融合文本信息与图像信息,提升对复杂文档或多媒体内容的理解与分析能力。
技术关键词
智能解析系统
融合语义
文本
多模态
协方差矩阵
视觉
节点
线性变换矩阵
数据
特征值
图像特征提取
聚类
坐标
解析技术
对象
嵌入方法
元素
系统为您推荐了相关专利信息
自动生成方法
兴趣特征向量
贝叶斯个性化排序
多模态
智能设备
核稿方法
统计语言模型
格式
电子设备
存储计算机程序
水源识别
光谱特征信息
光谱传感器
灰色关联算法
协方差矩阵