一种语义外延与内涵双驱动的多模态图像文本检索方法

正文

推荐专利

申请号：CN202511008765

申请日期：2025-07-22

公开号：CN120892596A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种语义外延与内涵双驱动的多模态图像文本检索方法，涉及数据检索技术领域，包括S1、获取原始图像与文本数据对的数据集；S2、构建外部场景知识库模块，将场景知识库中的语义的外延信息和内涵信息分别作为文本和图像的语义扩展与补充，进一步丰富图像和文本中的语义信息；S3、设计多模态语义表征模块，对扩展的语义外延和语义内涵进行特征表示，以此获得强化后的图像特征和文本特征补充，增强语义理解的深度和广度；S4、定义跨模态相似性计算框架，通过模态间相似性约束提升语义对齐精度，利用多模态对比学习损失函数约束优化模型参数；S5、将查询文本和扩展的语义外延信息进行整合并编码。

技术关键词

文本检索方法外延图像多模态约束优化模型集成编码器跨模态数据检索技术损失函数优化场景度量三元组强化特征语义特征框架模块融合特征

系统为您推荐了相关专利信息

一种基于渐进式迁移学习的行人轨迹预测方法

行人轨迹预测方法编码器模块终点迁移学习技术阶段

医学图像中病灶区域的分割方法和系统

医学图像分割模型分割方法感兴趣训练集滑动窗口采样

一种多射流火焰间相互作用结构的高速图像分析方法

图像分析方法火焰相互作用轮廓识别射流相邻两帧图像

一种改进ResNet18的玉米叶片病害分类方法

分类方法神经网络模型叶片图像残差模块

车辆的防盗预警方法、车辆和计算机可读存储介质

定位规则生物特征数据车辆运行状态面部特征识别多模态

一种语义外延与内涵双驱动的多模态图像文本检索方法

站点导航

APP 下载