一种语义外延与内涵双驱动的多模态图像文本检索方法

AITNT
正文
推荐专利
一种语义外延与内涵双驱动的多模态图像文本检索方法
申请号:CN202511008765
申请日期:2025-07-22
公开号:CN120892596A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了一种语义外延与内涵双驱动的多模态图像文本检索方法,涉及数据检索技术领域,包括S1、获取原始图像与文本数据对的数据集;S2、构建外部场景知识库模块,将场景知识库中的语义的外延信息和内涵信息分别作为文本和图像的语义扩展与补充,进一步丰富图像和文本中的语义信息;S3、设计多模态语义表征模块,对扩展的语义外延和语义内涵进行特征表示,以此获得强化后的图像特征和文本特征补充,增强语义理解的深度和广度;S4、定义跨模态相似性计算框架,通过模态间相似性约束提升语义对齐精度,利用多模态对比学习损失函数约束优化模型参数;S5、将查询文本和扩展的语义外延信息进行整合并编码。
技术关键词
文本检索方法 外延 图像 多模态 约束优化模型 集成编码器 跨模态 数据检索技术 损失函数优化 场景 度量 三元组 强化特征 语义特征 框架 模块 融合特征
系统为您推荐了相关专利信息
1
一种基于渐进式迁移学习的行人轨迹预测方法
行人轨迹预测方法 编码器模块 终点 迁移学习技术 阶段
2
医学图像中病灶区域的分割方法和系统
医学图像分割模型 分割方法 感兴趣 训练集 滑动窗口采样
3
一种多射流火焰间相互作用结构的高速图像分析方法
图像分析方法 火焰相互作用 轮廓识别 射流 相邻两帧图像
4
一种改进ResNet18的玉米叶片病害分类方法
分类方法 神经网络模型 叶片 图像 残差模块
5
车辆的防盗预警方法、车辆和计算机可读存储介质
定位规则 生物特征数据 车辆运行状态 面部特征识别 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号