基于大模型的机器人视觉物体语义理解与姿态生成方法

正文

推荐专利

申请号：CN202511107947

申请日期：2025-08-08

公开号：CN120997286A

公开日期：2025-11-21

类型：发明专利

摘要

本发明提供一种基于大模型的机器人视觉物体语义理解与姿态生成方法，属于图像处理技术领域。包括：S1.输入图像与3D模型；S2.物体检测；S3.多模态特征对齐；S4.扩散模型采样；S5.几何筛选；S6.NeRF形态建模；S7.光流优化；S8.联合损失计算；S9.置信度分析；S10.输出姿态结。本发明通过创新的单视角渲染‑光流优化闭环策略，显著降低了计算开销并提升了估计精度。本发明通过多尺度特征融合和置信度分解策略显著提升了复杂场景下的算法性能。

技术关键词

机器人视觉生成方法语义联合概率建模物体检测场景深度信息多模态特征特征金字塔多尺度特征融合坐标相机深度图图像处理技术策略检测器误差网络架构分辨率

系统为您推荐了相关专利信息

基于大语言模型的故障推理分析方法及系统

语义关联网络语义标签大语言模型实体标识符关系

基于深度学习的高度阀调节杆角度异常识别方法

高度阀异常识别方法调节杆融合语义分割巡检机器人

一种医疗影像标注系统及方法

影像标注系统颜色特征提取纹理特征提取任务分配策略特征提取单元

一种基于树形结构的查询语义表征方法及系统

树形结构表征方法语义节点自然语言

空中机械臂系统动力学可行轨迹实现系统及方法

机械臂系统轨迹生成方法机械臂关节升力轨迹生成系统

基于大模型的机器人视觉物体语义理解与姿态生成方法

站点导航

APP 下载