摘要
本发明公开了一种多模态数据融合的图像识别方法及系统,针对目标场景同步采集图像数据和非图像模态数据,并对图像数据和非图像模态数据进行预处理,将预处理后的数据均输入特征融合网络,由特征融合网络的图像分支提取图像数据的分层视觉特征、模态分支提取非图像模态数据的模态特征、交互层对提取到的特征进行融合,形成含跨模态关联信息的融合特征向量;将融合特征向量输入分类器,以识别得到目标场景中采集对象的信息和置信度,当置信度低于置信度阈值时重新进行特征提取与识别,形成“采集‑融合‑识别‑反馈”闭环优化。以此方式,通过充分考虑不同模态数据之间的内在联系和互补性,从而提高图像识别的准确性,并且增强识别过程的适应性。
技术关键词
多模态数据融合
特征融合网络
图像识别方法
模态特征
图像数据采集设备
视觉特征
图像采集设备
分层
分支
置信度阈值
联合损失函数
分类器
场景
注意力
图像识别系统
全局平均池化
模式噪声
对象
系统为您推荐了相关专利信息
数字孪生系统
活动推荐系统
出行技术
交互系统设计
仿真环境
投影模型
数模转换
计算机可执行指令
三维结构
拓扑结构特征
建模方法
时序特征
特征融合网络
时空融合特征
长短期记忆网络
语义分割模型
轮廓
深度预测模型
三维重建方法
边缘检测算法