一种基于语义信息融合的多视图室内深度估计方法和系统

正文

推荐专利

申请号：CN202510523201

申请日期：2025-04-24

公开号：CN120823251A

公开日期：2025-10-21

类型：发明专利

摘要

本发明属于机器人视觉深度估计领域，涉及一种基于语义信息融合的多视图室内深度估计方法和系统。该方法包括：采用预训练好的卷积神经网络预测输入图像中每个像素的深度，将其逐像素高斯参数化，并提取单目深度特征；采用空间金字塔网络提取各层次的图像特征，形成特征金字塔，并通过点积操作计算相似度，得到初始代价体；利用预训练好的语义特征提取网络提取图像的单目语义特征；将单目语义特征、单目深度特征和初始代价体结合形成最终代价体，输入三元组注意力加强的深度更新模块，迭代更新深度，得到深度估计结果。本发明能够解决室内场景中多视角深度估计存在的匹配失败，多视角信息利用不充分等问题。

技术关键词

语义特征提取深度估计方法空间金字塔特征金字塔多层次特征网络深度值图像存储计算机程序像素深度估计系统三元组深度特征提取多视角机器人视觉注意力模块深度残差

系统为您推荐了相关专利信息

基于RFID与深度学习的酒店保洁人员清洁合规性检测方法、系统及电子设备

RFID标签合规性检测方法二维图像数据清洁工具动作检测模型

基于扩散模型的无监督学习药片缺陷检测方法及相关装置

药片缺陷检测方法残差网络特征金字塔网络语义

复构架折断故障检测方法、装置、电子设备及介质

故障检测方法裂纹图像残差网络特征融合网络

基于SGR-YOLO模型的安全装备检测方法及系统

YOLO模型双向特征金字塔图像增强权重机制装备检测技术

基于CNN-Transformer-LSTM的锂电池健康状态预测方法

LSTM模型长短期记忆网络电压锂电池全生命周期多层次特征融合

一种基于语义信息融合的多视图室内深度估计方法和系统

站点导航

APP 下载