基于单视角图像和大语言模型引导的三维装配方法

正文

推荐专利

申请号：CN202411702338

申请日期：2024-11-26

公开号：CN119579896B

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种基于单视角图像和大语言模型引导的三维装配方法，用于服务机器人的自动装配。利用语义分割模型和边缘检测算法对单视角图像中的装配体进行部件级别的分割并获取相应的语义类别标签，实现对单视角图像的精确解析；设计了固定的提示词用以激活大语言模型中蕴含的装配先验知识，形成部件挑选规则，从而对三维装配的部件挑选过程进行指导，解决单视角图像中存在的部分遮挡问题；最终将从单视角图像中解析出的部件语义类别信息与大语言模型生成的装配次序信息编码进基于Transformer架构的部件装配网络，对挑选部件进行装配，预测其正确的装配位姿。大大提高了算法的泛化能力，提升了三维装配的精度。

技术关键词

视角图像大语言模型 Canny算子装配体点云特征装配部件语义分割模型边缘检测算法像素点信息编码边缘轮廓标签双阈值算法空间位置关系编码器服务机器人网络

基于单视角图像和大语言模型引导的三维装配方法

站点导航

APP 下载