基于多模态深度学习的三维场景语义理解方法及系统

AITNT
正文
推荐专利
基于多模态深度学习的三维场景语义理解方法及系统
申请号:CN202511199717
申请日期:2025-08-26
公开号:CN120997511A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及语义理解技术领域,具体为基于多模态深度学习的三维场景语义理解方法及系统,包括以下步骤:通过采集自动驾驶场景下点云图像与深度图并进行归一标准化与缺失填补,提取纹理几何空间特征并通过注意力机制融合,引入多时间步状态向量计算变化特征,建模道路参与物体间空间关系并构建动态实例图结构,推理语义标签并对比融合特征生成三维场景语义理解结果。本发明中,通过多源数据归一标准化保障融合质量,图像纹理与点云几何特征协同提取增强语义互补性,状态向量建模提升动态场景感知能力,空间关系图谱刻画物体交互语义关系,语义标签推理机制提升识别精准度与一致性,整体强化三维语义理解的完整性与鲁棒性。
技术关键词
场景语义理解 多模态深度学习 语义标签 融合特征 深度图 物体 图像纹理特征 关系 动态变化特征 注意力机制 车辆 点云 图谱 数据 多源特征 图像像素 坐标 动态场景感知
系统为您推荐了相关专利信息
1
一种基于时序大模型的球磨机粒度软测量方法
语言模块 软测量方法 统计特征 球磨机 矩阵
2
基于改进YOLOv5的电力设备红外热缺陷识别方法及系统
缺陷识别方法 电力设备 网络单元 深度卷积生成对抗网络 聚类
3
基于双分支图像融合的PRP制备质量评估方法
变形空间金字塔 图像卷积特征 样本 分支 融合特征
4
一种物品包装缺陷的检测方法及系统
物品包装 图像 卷积神经网络模型 薄膜特征 干扰特征
5
基于DL-MVCNN的风电次同步振荡溯源方法及系统
风电次同步振荡 溯源方法 通道注意力机制 非线性动力学模型 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号