摘要
本发明提供了一种基于RBF(Radial Basis Function)神经网络刚度预测和强化学习的机器人力控制方法,具体步骤如下:首先,通过多组PD(Proportional‑Derivative)控制收集机器人力跟踪的经验数据;然后,利用这些经验数据拟合强化学习的环境动力学模型;为加速强化学习的收敛速度,采用RBF神经网络对接触环境的刚度进行拟合并预测环境刚度,预测的环境刚度结合高斯模型得到环境刚度选择概率;最后,根据环境刚度选择概率并结合刚度模型修正PD控制参数中P参数的选择概率,从而改善强化学习中的动作选择概率,快速找到机器人力控制的最优参数。
技术关键词
RBF神经网络
刚度
人力
参数
BP神经网络构建
拟合强化学习
贪心策略
强化学习环境
挖掘机器人
深度Q网络
离线
数据
误差
物体
编码
信号
滤波
系统为您推荐了相关专利信息
优化测试方法
动态性能参数
功能模块
输入测试条件
芯片
地理围栏
设备控制参数
预警方法
气象监测数据
空间拓扑关系
静态时序分析
设计规则检查
布线
命令
寄生参数提取