一种多模态数据增强及其融合方法、装置、设备以及介质

正文

推荐专利

申请号：CN202510834783

申请日期：2025-06-20

公开号：CN120707989B

公开日期：2025-12-09

类型：发明专利

摘要

本发明涉及图像处理技术，揭露一种多模态数据增强及其融合方法，包括：获取多模态数据，并计算每种模态数据的高斯噪声向量；将每种模态数据的高斯噪声向量输入至多模态联合生成网络中进行数据生成，得到多模态数据组；提取多模态数据组中RGB图像数据以及Thermal图像数据的模态特征，并跨模态融合RGB图像数据以及Thermal图像数据的模态特征得到初始RGB_Thermal融合特征；提取多模态数据组中LiDAR点云特征；将LiDAR点云特征与初始RGB_Thermal融合特征进行特征融合得到多模态BEV视角特征。本发明还提出一种多模态数据增强及其融合装置、设备及介质。本发明可以提升环境检测和识别的准确率。

技术关键词

多模态模态特征数据融合方法融合特征图像全局特征 LiDAR点云视角融合装置异构噪声矩阵交叉注意力机制网络处理器图像处理技术

系统为您推荐了相关专利信息

一种消防安防管理方法及系统

安防管理方法数据处理模块多智能体强化学习安防设备环境传感器

一种PDF扫描件识别方法、设备及介质

页面图片识别PDF文件多模型协同识别方法图片分类模型

一种货运自动驾驶示范应用效果评价方法

评价方法处理错误数据数据处理模块有效性评价指标体系

基于DT机器学习模型的典型树种生长预测方法及系统

生长预测方法输电线路走廊构建决策树典型神经网络模型

一种OFDM系统高峰值平均功率比抑制系统及方法

高峰值平均功率比 OFDM系统网络解码器空洞转换单元

一种多模态数据增强及其融合方法、装置、设备以及介质

站点导航

APP 下载