摘要
本发明提供一种基于选择性状态空间与有模型强化学习的机械臂操控方法,首先根据真实环境构建世界模型,世界模型处理第三人称视角下的高维视觉图像,提取图像特征并整合序列状态‑动作信息,机械臂模型再根据世界模型提取的特征信息进行决策与学习,能在较低的交互次数下最大化样本效率,仅利用较少的计算资源就可以让机械臂学习到物品抓取方法,能够提升有模型强化学习算法在不同任务场景中的泛用性,降低训练成本和在实际环境中的部署难度,提升计算效率。
技术关键词
机械臂
操控方法
图像解码器
末端控制器
计算方法
混合器
物品抓取方法
动态
序列
数据
编码器
图像传感器
强化学习算法
笛卡尔坐标系
轨迹
决策
信号
多层感知机
策略
系统为您推荐了相关专利信息
暂态过电压
容量计算方法
交直流混联系统
送端系统
换流变压器
故障定位装置
峰值检测电路
边缘计算方法
柔性罗氏线圈
积分电路
关节电机
交互控制方法
静止平衡状态
机械臂运动学
平衡电机
火焰识别方法
智能摄像机
图形预处理方法
画面
网络连接器