多模态文本智能解析系统

AITNT
正文
推荐专利
多模态文本智能解析系统
申请号:CN202510557795
申请日期:2025-04-29
公开号:CN120408521A
公开日期:2025-08-01
类型:发明专利
摘要
本发明涉及多模态文本解析技术领域,具体涉及多模态文本智能解析系统。该系统包括:本发明提取多模态文本的文本特征和图像特征,将文本特征和图像特征进行矩阵坐标变换,并进行降维处理得到分解向量,计算分解向量的空间距离D,基于空间距离D判断文本特征和图像特征是否满足多模态嵌入语义表示提取要求,得到视觉嵌入式语义表示和文本嵌入式语义表示;对视觉嵌入式语义表示和文本嵌入式语义表示进行聚类处理得到若干个语义表示对,并将语义表示对进行对齐融合处理,得到融合语义表示,对融合语义表示通过图卷积神经网络进行学习,得到学习结果,能够通过融合文本信息与图像信息,提升对复杂文档或多媒体内容的理解与分析能力。
技术关键词
智能解析系统 融合语义 文本 多模态 协方差矩阵 视觉 节点 线性变换矩阵 数据 特征值 图像特征提取 聚类 坐标 解析技术 对象 嵌入方法 元素
系统为您推荐了相关专利信息
1
一种基于用户画像的自媒体多维度投流优化方法和系统
生成文本内容 热力图 内容流 缓存策略 语义特征
2
一种基于制造行业大模型的订单审核方法
订单审核方法 格式 训练集 数据 图片
3
一种基于人工智能的旅游攻略自动生成方法
自动生成方法 兴趣特征向量 贝叶斯个性化排序 多模态 智能设备
4
公文核稿方法、装置、电子设备及存储介质
核稿方法 统计语言模型 格式 电子设备 存储计算机程序
5
一种智能水源识别光谱传感器及智能水源识别方法
水源识别 光谱特征信息 光谱传感器 灰色关联算法 协方差矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号