摘要
本申请提出一种基于概率化三维高斯的场景语义占有预测方法,包括:使用二维主干网络处理多视角相机图像,生成多视角多尺度的图像特征,并由图像特征预测与像素对齐的三维占用分布,根据该分布初始化三维高斯的位置属性;将三维高斯视为点云数据,通过体素化生成稀疏体素数据,利用三维稀疏卷积对稀疏体素数据进行处理,完成三维高斯间的特征交互;通过使用交叉注意力机制,由图像特征更新三维高斯的特征;使用高斯属性微调模型对三维高斯的特征中的各属性进行逐层迭代优化;使用概率高斯叠加方法聚合三维高斯的几何属性与语义属性,生成场景的三维语义占用预测结果。本申请能够解决自动驾驶场景的高效自适应三维语义占有预测问题。
技术关键词
多视角
交叉注意力机制
语义
计算机执行指令
叠加方法
生成场景
位置映射
多尺度
像素
数据
点云
坐标系
高斯混合模型
相机
网络
表达式
图像处理模块
可读存储介质
系统为您推荐了相关专利信息
内存访问请求
网络访问请求
网络控制器
远程内存访问
地址映射关系
日志异常检测方法
GRU模型
序列
词嵌入向量
模板
大语言模型
拼写纠错方法
输入中文
模板
生成提示词
环境内分泌干扰物
数据整合分析方法
多组学数据整合分析
分布式爬虫框架
XML格式数据
评分卡构建
语义特征
多源异构数据
金融
数据获取单元