基于图像点云跨模态融合与动作分块Transformer的机械臂控制方法及系统

正文

推荐专利

申请号：CN202510851897

申请日期：2025-06-24

公开号：CN120620192A

公开日期：2025-09-12

类型：发明专利

摘要

本发明属于具身智能领域，涉及一种基于图像点云跨模态融合与动作分块Transformer的机械臂控制方法及系统，包括：根据多视角RGB图像和对应的深度图构建场景点云；利用场景点云在机械臂工作空间周围生成多视角融合图像‑点云信息的虚拟视图；将多视角融合图像‑点云信息的虚拟视图输入到特征提取网络中，得到特征图；获取机械臂中各个关节状态和历史动作序列，并将关节状态进行投影；将特征图、投影后的关节状态以及历史动作序列输入到编码器中，得到编码特征；将编码特征输入到解码器中，基于动作分块策略预测机械臂动作序列；根据机械臂动作序列对机械臂进行控制；本发明将点云图像多模态感知数据整合为统一的特征表示，并结合动作分块Transformer实现机械臂的智能动作规划，从而提升机器人对复杂任务的全局理解和决策能力。

技术关键词

机械臂控制方法点云信息特征提取网络编码特征图像多视角解码器序列关节预测机械深度图分块策略机械臂控制系统渲染单元金字塔解码单元

系统为您推荐了相关专利信息

基于多模态感知数据的机器人交互方法及系统、机器人

机器人交互方法多模态对象数据机器人交互系统

一种仓储智能起重系统的钢包抓取控制方法及系统

抓取控制方法仓储智能起重系统激光扫描仪彩色图像数据

基于SCG-PPG信号的MRI实时触发方法、系统、终端及介质

数学模型心脏周期性滑动时间窗生理状态信息

一种基于增强热传递方法和图像卷积的路径规划方法

路径规划方法热扩散模型热传递方法刀具路径距离图像

绘图方法、装置、计算设备及程序产品

绘图装置轮廓画布感兴趣特征绘图方法

基于图像点云跨模态融合与动作分块Transformer的机械臂控制方法及系统

站点导航

APP 下载