摘要
本方案公开了的一种动态场景下的相机位姿估计算法,包括以下步骤:S1、将视频帧输入到光流估计神经网络(CNN),获取相邻图像帧的稠密光流;S2、将稠密光流、视频帧输入到运动分割网络,获取二进制掩码,利用掩码阈值化光流获得运动分割结果;S3、将运动分割结果输入到Transformer的模块,充分提取上下文信息;S4、将步骤S3提取的上下文信息输入到残差神经网络,进行特征提取;S5、将步骤S4的内容使用全连接神经网络计算,获得相机位姿。通过该算法,能够在复杂的动态环境中,精准地分割出静态和动态区域,并充分利用图像的上下文信息,实现对相机六自由度位姿的精确估计。
技术关键词
相机位姿估计
动态场景
稠密光流
残差神经网络
视频帧
算法
全局平均池化
运动
注意力
动静态
像素
图像
上采样
通道
模块
系统为您推荐了相关专利信息
防护装备
合规性检测方法
三维人体形状
人体骨骼关键点
网络
土壤墒情数据
预测系统
传感器模组
气象传感器
电阻式湿度传感器
粒子滤波器
烟丝样品
视觉
动态更新
可读存储介质