面向文档的标准要素与应用场景语义集成多模态检索方法

AITNT
正文
推荐专利
面向文档的标准要素与应用场景语义集成多模态检索方法
申请号:CN202511092239
申请日期:2025-08-05
公开号:CN120994808A
公开日期:2025-11-21
类型:发明专利
摘要
本发明提出了面向文档的标准要素与应用场景语义集成多模态检索方法,属于信息检索技术领域;包括:获得源文档的不同模态数据,并对源文档不同模态数据进行各个方向的特征提取,对提取以后的源文档特征融合成统一语义表征向量;并提取目标文档的各个方向的特征信息,并融合成目标文档的统一语义表征向量;通过多模态对齐算法源文档与目标文档的多尺度相似度,生成多个待选匹配结果;通过选择总相似度最大的待选匹配结果得到最终匹配结果;该方法旨在通过语义建模技术,实现文本、图像和结构化元数据的协同检索;在相似度计算时,不但充分考虑了源文档和目标文档的总相似度,还使得单方向的相似度保持在一定的水平,匹配的结果更加符合真实结果。
技术关键词
多模态检索方法 语义 数据嵌入 场景 视觉特征 文本编码器 对齐模块 序列 图像 交叉注意力机制 多尺度特征提取 信息检索技术 训练语言模型 文档特征 模版
系统为您推荐了相关专利信息
1
基于生成对抗网络的单张图像半透明材质编辑方法
生成对抗网络 透明度 编辑方法 编码向量 图像编码器
2
图像多人标注的优化方法、装置、控制设备及存储介质
图像 数据标注技术 控制设备 场景 深度哈希
3
电力领域的知识图谱的构建方法及电子设备
关键词 数据 长短期记忆网络 自然语言 构建知识图谱
4
客服知识库更新方法、系统、计算机设备和存储介质
客服知识库 会话 知识点 更新方法 答案
5
一种基于运动学习和图像特征表示融合的微表情识别方法
运动特征 表情识别方法 面部 图像 信息融合机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号