摘要
本发明公开了一种基于Transformer‑CNN的平面抓取位姿的处理方法及系统,属于视觉抓取及预测技术领域。包括以下步骤:对预测数据集进行预处理,获取输入图像;构建基于Transformer‑CNN的平面抓取位姿预测模型;平面抓取位姿预测模型包括编码器模块、解码器模块以及抓取预测模块;将获取的输入图像输入到构建的平面抓取位姿预测模型中进行模型训练与测试:使用训练后的平面抓取位姿预测模型获取抓取配置,生成预测结果。相较于现有技术,本发明的有益之处在于,实现了对抓取特征表示的增强、多层级特征交互与信息保留的优化,以及抓取位姿预测准确性与泛化能力的提升。
技术关键词
高频混频器
编码器模块
多层级特征
解码器
矩形
模型训练模块
数据获取模块
通道
图像分割
上采样
样本
注意力
定义
地面
参数
指数
系统为您推荐了相关专利信息
时间序列预测系统
多层感知机
注意力机制
长短期记忆网络
特征提取模块
图像去雾方法
训练深度估计模型
大气散射模型
生成对抗网络
去雾图像
拓扑分析方法
拓扑特征
融合神经网络
面向配电网
动态
模拟肺部呼吸
医学图像数据
编码器解码器
深度学习方法
阶段