摘要
本发明公开了一种多模态影像自动标注系统及方法,涉及图像数据处理技术领域。该一种多模态影像自动标注系统及方法,通过非对称动态时间规整算法对视频流与激光雷达点云数据进行时序对齐,提取语义与几何特征,动态调整算法的弹性系数。结合模态感知注意力机制,根据特征动态分配视频流与激光雷达的融合权重,生成跨模态联合特征向量,输出初步标注结果。通过计算目标检测框的预测熵及三维交并比置信度,生成标注鲁棒性指数,迭代优化标注结果。将跨模态特征与标注结果映射为时空关联图谱,实时展示目标的三维定位、运动轨迹及模态贡献度热力图。有效解决了时间对齐、特征融合和标注鲁棒性的问题,提供了高精度、可解释性的自动标注解决方案。
技术关键词
动态时间规整算法
标注系统
多模态
视频流
跨模态
鲁棒性
注意力机制
语义特征
权重分配策略
时序
激光雷达点云
指数
影像
热力图
激光雷达数据
采样率
图谱
可视化模块
系统为您推荐了相关专利信息
智能管道检测机器人
融合双目视觉
环境感知模型
双目视觉模块
障碍物识别
虚拟切片
数据加密传输方法
关键帧
生成加密密钥
信令
编码特征
视频帧
时空注意力模型
大语言模型
视频理解方法