摘要
本发明提供一种结合协作者意图基于改进深度强化学习的人机协作柔顺控制方法。基于径向基神经网络实时估计人类的运动意图;采用结合GP的DDPG算法,代替了传统DDPG中的策略网络,实现对自适应阻抗控制中阻抗参数的优化;针对GP模型中超参数优化,采用k折交叉验证的方法;采用平滑切换策略,选择合适的策略。最终,保证机械臂柔顺性的同时,安全高效实现的人机协作的过程。
技术关键词
柔顺控制方法
人机协作
深度强化学习
径向基神经网络
运动意图
GP模型
阻尼参数
机械臂运动学
阻尼模型
笛卡尔
策略
雅可比矩阵
系统特征
非线性函数关系
外界环境交互
上肢
轨迹
系统为您推荐了相关专利信息
深度强化学习
三维虚拟环境
导航方法
肾脏
坐标系
动态航迹
深度强化学习算法
规划算法
设计无人机
信息熵
移动式储能电池
运输调度方法
储能船舶
能源运输模型
船用动力电池
深度强化学习模型
高速公路合流区
协同控制方法
车道
网络控制策略
硬件加速器电路
神经网络推理
浮点运算单元
高能效
DNN模型