一种基于多模态语义融合的智能图像数据标注方法及系统

正文

推荐专利

申请号：CN202510688288

申请日期：2025-05-27

公开号：CN120544164A

公开日期：2025-08-26

类型：发明专利

摘要

本发明适用于图像标注及智能交通技术领域，提供了一种基于多模态语义融合的智能图像数据标注方法及系统，该方法包括以下步骤：获取同一时空的图像数据、点云数据、语音数据以及环境信息；对图像数据进行语义分割，得到图像分割信息；将点云数据与图像数据进行对齐处理，生成与图像像素对齐的3D点云；根据3D点云，推断被遮挡目标的几何轮廓，得到点云几何信息；结合环境信息，将图像分割信息与点云几何信息进行融合，得到图像融合信息；结合语音数据，根据图像融合信息对图像数据中的可见目标以及被遮挡目标进行带有行为语义的标注。本发明通过融合图像、语音和点云等多模态数据，可以准确对复杂场景中被遮挡目标进行语义标注。

技术关键词

图像融合信息图像分割信息数据标注方法数据标注系统多模态图像像素语音 3D点云数据对齐模块语义向量深度学习模型坐标系聚类矩阵轮廓智能交通技术

系统为您推荐了相关专利信息

一种动物病源防控用的动物皮张有害因子检测方法及系统

物联网实时监控动物电化学传感器多模态传感器因子

一种基于人工智能的新建管线规划路径分析方法及系统

路径分析方法多源数据融合平台基础地理信息三维地质模型国土空间规划

基于IoT和AI的冬枣保鲜控制方法及其系统

冬枣品质保鲜控制方法参数多模态近红外光谱特征

一种多模态信息融合的光伏超短期功率预测方法及系统

光伏超短期功率预测方法像素点融合特征多模态信息融合时序特征

多模态错误信息检测方法以及装置

错误信息检测方法节点多模态工具组合检测工具

一种基于多模态语义融合的智能图像数据标注方法及系统

站点导航

APP 下载