摘要
本发明的基于MAMBA和选择性记忆三维空间的机器人动作预测方法,包括:将机器人采集的多视角RGB‑D图像数据转换为三维体素网格;使用预训练的语言模型对任务目标以及三维体素网格进行编码,将其转换语言特征向量和三维体素网格特征向量;通过3D‑Mamba模型压缩成二维体素网格特征向量;将二维体素网格特征向量与语言特征向量结合,形成输入序列;输入序列通过Perceiver变压器进行处理,生成带有位置信息的输入向量;将带有位置信息的输入向量通过选择性记忆CA‑SSM结构存储历史信息,基于此进行动作预测;使用监督学习方法对整体模型进行训练,每个动作通过最大化Q函数进行选择,直到任务完成。
技术关键词
动作预测方法
网格
机器人
监督学习方法
存储历史信息
序列
数据
迭代优化方法
运动规划器
监督学习模型
状态空间模型
前馈神经网络
记忆结构
编码
变压器
补丁
注意力机制
传播算法
系统为您推荐了相关专利信息
局部结构特征
衰减特征
多尺度特征融合
反射特征
三维重建方法
三分量力传感器
行走机器人
传感器本体
安装板
安装组件
绝缘劣化检测装置
导轨式
金属连接件
机器人
绝缘检测方法
电力巡检机器人
机器人底座
升降式
双轴电机
移动巡检
大语言模型
样本
非暂态计算机可读存储介质
场景
语句