摘要
本发明公开了一种机器人抓取姿态预测方法、装置、设备及存储介质,涉及机器人视觉领域。所述方法包括以物体图像和隐含意图的文本指令为输入,以明确意图的文本指令为期望输出,对意图推理模型进行训练;以物体图像和明确意图的文本指令为输入,以区域分割图像为期望输出,对区域分割模型进行训练;利用训练后的意图推理模型对待处理图像和待处理文本指令进行意图推理;根据明确意图的待处理文本指令,利用训练后的区域分割模型对待处理图像进行分割;根据待处理区域分割图像,在待处理图像中进行区域级标记,并生成区域级抓取姿态。本发明提高了人类意图的理解能力和区域分割的准确性,提高了抓取姿态预测精度。
技术关键词
姿态预测方法
机器人抓取
意图
指令
文本特征向量
适配器
物体
文本编码器
图像编码器
图像特征向量
样本
预测装置
融合特征
解码器
机器人视觉
输出模块
系统为您推荐了相关专利信息
视频播放方法
控件
展示方法
视频播放装置
关键词
人机交互系统
人机界面设计技术
动态
频率
存储器