一种面向粮食生产的跨模态表征学习与检索方法及系统

正文

推荐专利

申请号：CN202511195014

申请日期：2025-08-26

公开号：CN120705355B

公开日期：2025-12-02

类型：发明专利

摘要

本申请公开了一种面向粮食生产的跨模态表征学习与检索方法及系统，涉及农业信息化领域，该方法包括：基于图文双向引导融合网络对粮食生产过程中的图像文本对进行多粒度语义对齐，得到语义分割图像；基于全局语义引导对粮食生产过程中的视频文本对进行图像空间解耦与时序增强，得到结构化语义图像特征；构建文本特征库及图像特征库；根据待检索数据的模态确定传输计划矩阵，基于传输计划矩阵生成待检索数据的查询特征，根据待检索数据的查询特征、文本特征库及图像特征库，采用相似度度量的方法输出文本查询结果或图像查询结果。本申请能够实现跨模态特征的深度融合，提升图像与文本语义匹配的准确性，实现图像与文本之间的快速、精准匹配与检索。

技术关键词

图像上下文特征检索方法文本视觉注意力机制查询特征语义向量特征提取模块图文融合特征多尺度空间金字塔池词语通道注意力机制空间特征提取视频长短期记忆网络时序

系统为您推荐了相关专利信息

虚拟角色的动作生成方法及装置

关键点动作生成方法图像轴旋转坐标系

一种基于陀螺辅助的星敏感器动态星图处理方法和装置

光斑陀螺运动星敏感器估计误差

一种焦饼中心温度提取方法

温度提取方法图像处理算法深度学习算法训练卷积神经网络神经网络对图像

一种特征引导多阶段生成对抗网络的SAR图像生成方法、网络、设备及介质

生成对抗网络图像生成方法多阶段方位角属性散射中心模型

一种工业图纸表格数据的提取方法、系统及终端设备

表格图纸图像边缘检测算法工业

一种面向粮食生产的跨模态表征学习与检索方法及系统

站点导航

APP 下载