摘要
本发明提供一种基于大模型的机器人视觉物体语义理解与姿态生成方法,属于图像处理技术领域。包括:S1.输入图像与3D模型;S2.物体检测;S3.多模态特征对齐;S4.扩散模型采样;S5.几何筛选;S6.NeRF形态建模;S7.光流优化;S8.联合损失计算;S9.置信度分析;S10.输出姿态结。本发明通过创新的单视角渲染‑光流优化闭环策略,显著降低了计算开销并提升了估计精度。本发明通过多尺度特征融合和置信度分解策略显著提升了复杂场景下的算法性能。
技术关键词
机器人视觉
生成方法
语义
联合概率建模
物体检测
场景深度信息
多模态特征
特征金字塔
多尺度特征融合
坐标
相机
深度图
图像处理技术
策略
检测器
误差
网络架构
分辨率
系统为您推荐了相关专利信息
语义关联网络
语义标签
大语言模型
实体标识符
关系
高度阀
异常识别方法
调节杆
融合语义分割
巡检机器人
影像标注系统
颜色特征提取
纹理特征提取
任务分配策略
特征提取单元
机械臂系统
轨迹生成方法
机械臂关节
升力
轨迹生成系统