摘要
本发明提供了一种基于有模型强化学习的机器人打磨力控制算法,其特点是包括以下步骤信号采集、初始策略的构建、构建强化学习环境动力学模型、强化学习补偿策略及算法融合;其优点是旨在稳定维持机器人打磨过程,实现高精度的打磨质量;本控制算法融合了强化学习算法与传统的PID控制算法,传统算法确保算法的安全性,强化学习算法对PID残差项进行补偿,确保了算法的精确性,为加快寻找残差项的补偿策略,构建了强化学习环境动力学模型,模拟机器人的打磨过程,在模拟环境下离线训练以减少强化学习实际交互的次数,同时提升算法的实用性。相比于传统的智能控制算法策略,基于有模型强化学习的机器人打磨力控制算法具有更好的通用性。
技术关键词
强化学习环境
强化学习算法
强化学习策略
深度确定性策略梯度
机器人末端执行器
RBF神经网络
智能控制算法
PID算法
后机器人
刚度
误差
低通滤波器
受力
信号
表达式
非线性
系统为您推荐了相关专利信息
数字孪生模型
控制策略
智能分析算法
深度学习算法
模型预测控制算法
井下设备
远程控制系统
深度确定性策略梯度
设备运行参数
光纤布拉格光栅传感器
视觉检测系统
深度确定性策略梯度
金字塔特征
实时图像
滑动窗口优化
巡视探测器
三维地形模型
学习训练方法
强化学习算法
微重力