一种基于跨模态视觉语言检索的施工安全风险预警方法及系统

AITNT
正文
推荐专利
一种基于跨模态视觉语言检索的施工安全风险预警方法及系统
申请号:CN202510028717
申请日期:2025-01-08
公开号:CN120146549A
公开日期:2025-06-13
类型:发明专利
摘要
本发明涉及一种基于跨模态视觉语言检索的施工安全风险预警方法及系统,属于组合图像检索及多模态检索的技术领域,设计多粒度的图像‑文本语义特征解耦模块、多粒度特征组合模块、多粒度组合‑目标对齐模块,通过多粒度语义解耦技术,将图像和文本的局部特征和全局特征分别进行解耦,同时考虑多模态查询与目标图像之间的对齐,将多模态查询中的图像与文本的解耦特征进行多粒度组合,得到多模态查询的多粒度组合特征,从多粒度层面推动组合特征接近目标图像特征,实现多粒度细节层面的跨模态对齐,以更精准地对齐多模态查询和目标图像之间的语义信息,从而提升整体的跨模态理解和应用效果。
技术关键词
风险预警方法 跨模态 语义特征 多粒度特征 组合特征提取 多层感知机 图像检索模型 文本编码器 视觉 代表 通道 对齐模块 组合模块 风险预警系统 图像多模态
系统为您推荐了相关专利信息
1
一种语义数据驱动的弱小目标视觉检测方法和检测设备
视觉检测方法 多级特征 语义特征提取 模态特征 交互注意力
2
基于空间通道注意力网络的红外图像小目标分割方法
层级 空洞 编码器 上采样 采样模块
3
基于多模态数据库的金属材料智能自洽筛检方法及系统
多模态数据库 金属材料 特征提取网络 成分含量 深度学习网络
4
基于人工智能的多场景灯饰控制系统
灯饰控制系统 空间特征提取方法 视觉特征 场景 跨模态
5
基于AI的水利灾害预警方法、系统、设备及存储介质
灾害预警方法 多模态传感器 特征提取网络 立方体 水利
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号