面向文档的标准要素与应用场景语义集成多模态检索方法

正文

推荐专利

申请号：CN202511092239

申请日期：2025-08-05

公开号：CN120994808A

公开日期：2025-11-21

类型：发明专利

摘要

本发明提出了面向文档的标准要素与应用场景语义集成多模态检索方法，属于信息检索技术领域；包括：获得源文档的不同模态数据，并对源文档不同模态数据进行各个方向的特征提取，对提取以后的源文档特征融合成统一语义表征向量；并提取目标文档的各个方向的特征信息，并融合成目标文档的统一语义表征向量；通过多模态对齐算法源文档与目标文档的多尺度相似度，生成多个待选匹配结果；通过选择总相似度最大的待选匹配结果得到最终匹配结果；该方法旨在通过语义建模技术，实现文本、图像和结构化元数据的协同检索；在相似度计算时，不但充分考虑了源文档和目标文档的总相似度，还使得单方向的相似度保持在一定的水平，匹配的结果更加符合真实结果。

技术关键词

多模态检索方法语义数据嵌入场景视觉特征文本编码器对齐模块序列图像交叉注意力机制多尺度特征提取信息检索技术训练语言模型文档特征模版

系统为您推荐了相关专利信息

基于生成对抗网络的单张图像半透明材质编辑方法

生成对抗网络透明度编辑方法编码向量图像编码器

图像多人标注的优化方法、装置、控制设备及存储介质

图像数据标注技术控制设备场景深度哈希

电力领域的知识图谱的构建方法及电子设备

关键词数据长短期记忆网络自然语言构建知识图谱

客服知识库更新方法、系统、计算机设备和存储介质

客服知识库会话知识点更新方法答案

一种基于运动学习和图像特征表示融合的微表情识别方法

运动特征表情识别方法面部图像信息融合机制

面向文档的标准要素与应用场景语义集成多模态检索方法

站点导航

APP 下载