摘要
本公开的实施例提供一种三维模型目标跟踪的方法,包括:获取当前帧三维模型数据、前一帧三维模型数据和前一帧三维目标框并进行数据预处理,得到预处理结果,预处理结果包括:时空三维模型和置信度;利用Transformer网络处理所述预处理结果,生成局部特征,局部特征包括:前一帧特征和当前帧特征;将时空三维模型输入PointNet网络模型,生成全局特征;将局部特征和全局特征进行融合,得到融合特征;将融合特征输入至MLP层进行处理,生成目标三维模型;基于目标三维模型,通过运动预测,预测前一帧到当前帧的相对位置偏移,基于相对位置偏移对目标三维模型进行定位,得到当前帧三维目标框。利用Transformer网络的自注意力机制,更适配三维模型。融入全局信息和运动信息,以提高目标识别的准确性和跟踪的稳定性。
技术关键词
融合特征
编码特征
融入全局信息
数据
三维模型特征
网络
K近邻算法
特征提取模块
处理器
注意力机制
运动
计算机设备
存储装置
可读存储介质
程序
编码器
系统为您推荐了相关专利信息
病害防控
管理系统
深度学习模型
云端管理平台
置信度阈值
布局规划方法
变压器耐压
平台
NSGA算法
仿真分析
姿态校正
图像
生成虚拟形象
矫正
计算机程序产品
动态知识图谱
多源异构数据
混合神经网络模型
生成测试用例
校验方法