摘要
本发明公开了一种基于无模型强化学习的空间绳驱机械臂的控制方法,包括以下步骤:S1:利用多关节接触动力学对所述空间绳驱机械臂建立仿真环境,其中,所述空间绳驱机械臂包括漂浮基座和绳驱机械臂,所述绳驱机械臂的第一端连接于所述漂浮基座上,所述绳驱机械臂的另一端为所述空间绳驱机械臂的末端点;S2:构建基于稠密奖励函数的强化学习框架并设计奖励函数,以对所述空间绳驱机械臂进行控制,其中所述奖励函数与各时刻所述空间绳驱机械臂的末端点相对于目标点之间的距离相关。本发明提出的基于无模型强化学习的空间绳驱机械臂的控制方法,能够提升策略的泛化性,增强智能体执行复杂任务的能力。
技术关键词
绳驱机械臂
强化学习框架
漂浮基座
代表
仿真环境
策略
多关节
剪切噪声
可读存储介质
定义
参数
计算机
肌腱
处理器
数值
算法
网络
模块
系统为您推荐了相关专利信息
三维点云配准方法
局部特征描述符
节点
聚类
指标
车辆路径规划方法
邻域
客户
车辆路径规划系统
运输车辆
反步滑模控制
水下机器人
坐标系
滑模控制器
雅克比矩阵
哺乳期母猪
纹理特征
动态预测模型
生理
背膘厚度