摘要
本发明提供了一种融合不同补偿策略的机器人打磨力控制算法,其特点是包括以下步骤:通过阻抗控制建立了机器人打磨的初始策略;为适应时变的打磨加工环境接触,分别利用强化学习和刚度模型对阻抗控制的策略进行补偿;为快速得到强化学习的策略,构建一种基于环境动力学模型的强化学习算法,并离线训练策略;为充分融合刚度模型快速计算的优势和强化学习具有自主学习的能力,基于高斯混合模型‑高斯回归模型GMM/GMR算法融合三种不同的补偿策略,其优点是提升算法的鲁棒性和通用性以适应机器人打磨环境。
技术关键词
机器人
刚度
强化学习算法
BP神经网络构建
离线
在线
高斯混合模型
深度Q网络
人力
数据
融合策略
信号
非线性
误差
鲁棒性
轨迹
样本
系统为您推荐了相关专利信息
作物水分胁迫信息
温室草莓
作物水分胁迫检测技术
阈值分割算法
挂轨式巡检机器人