摘要
本发明涉及一种基于跨模态视觉语言检索的施工安全风险预警方法及系统,属于组合图像检索及多模态检索的技术领域,设计多粒度的图像‑文本语义特征解耦模块、多粒度特征组合模块、多粒度组合‑目标对齐模块,通过多粒度语义解耦技术,将图像和文本的局部特征和全局特征分别进行解耦,同时考虑多模态查询与目标图像之间的对齐,将多模态查询中的图像与文本的解耦特征进行多粒度组合,得到多模态查询的多粒度组合特征,从多粒度层面推动组合特征接近目标图像特征,实现多粒度细节层面的跨模态对齐,以更精准地对齐多模态查询和目标图像之间的语义信息,从而提升整体的跨模态理解和应用效果。
技术关键词
风险预警方法
跨模态
语义特征
多粒度特征
组合特征提取
多层感知机
图像检索模型
文本编码器
视觉
代表
通道
对齐模块
组合模块
风险预警系统
图像多模态
系统为您推荐了相关专利信息
视觉检测方法
多级特征
语义特征提取
模态特征
交互注意力
多模态数据库
金属材料
特征提取网络
成分含量
深度学习网络
灯饰控制系统
空间特征提取方法
视觉特征
场景
跨模态
灾害预警方法
多模态传感器
特征提取网络
立方体
水利