摘要
本发明涉及图像处理技术,揭露一种多模态数据增强及其融合方法,包括:获取多模态数据,并计算每种模态数据的高斯噪声向量;将每种模态数据的高斯噪声向量输入至多模态联合生成网络中进行数据生成,得到多模态数据组;提取多模态数据组中RGB图像数据以及Thermal图像数据的模态特征,并跨模态融合RGB图像数据以及Thermal图像数据的模态特征得到初始RGB_Thermal融合特征;提取多模态数据组中LiDAR点云特征;将LiDAR点云特征与初始RGB_Thermal融合特征进行特征融合得到多模态BEV视角特征。本发明还提出一种多模态数据增强及其融合装置、设备及介质。本发明可以提升环境检测和识别的准确率。
技术关键词
多模态
模态特征
数据
融合方法
融合特征
图像全局特征
LiDAR点云
视角
融合装置
异构
噪声
矩阵
交叉注意力机制
网络
处理器
图像处理技术
系统为您推荐了相关专利信息
安防管理方法
数据处理模块
多智能体强化学习
安防设备
环境传感器
页面图片
识别PDF文件
多模型协同
识别方法
图片分类模型
评价方法
处理错误数据
数据处理模块
有效性
评价指标体系
生长预测方法
输电线路走廊
构建决策树
典型
神经网络模型
高峰值平均功率比
OFDM系统
网络解码器
空洞
转换单元