摘要
本发明公开了一种多视角时空特征融合的无监督单目视觉位姿估计方法,属于无监督单目视觉位姿估计领域,该方法包括将图像序列的相邻帧进行两两拼接,得到若干对相邻帧序列数据;将各相邻帧序列数据分别经通道注意力深度估计网络和位姿估计网络处理,得到若干深度图和若干位姿变换矩阵;对各深度图、各位姿变换矩阵以及各相邻帧序列数据分别进行图像配准,得到位姿预测结果;根据位姿预测结果计算损失,优化位姿估计网络和通道注意力深度估计网络;获取待测图像,利用训练完成的位姿估计网络和通道注意力深度估计网络完成位姿估计。本发明解决了无监督单目视觉位姿估计网络面对复杂动态场景时,位姿预测中精准度较低和适应性较差的问题。
技术关键词
视觉位姿估计
上下文特征
多视角
模块
运动特征
网络解码器
注意力
空间特征提取
特征融合网络
融合特征
深度图
序列
多层卷积神经网络
图像配准
矩阵
通道
数据
系统为您推荐了相关专利信息
表面清洁方法
打磨室
表面清洁系统
腻子
分析模块
超宽带测距方法
异常对象
蓝牙芯片
控制单元
异常状态
数字式仪表
感兴趣区域图像
文本识别
检测识别方法
对比度