摘要
本发明公开了一种基于近端策略优化的骨磨削强化学习系统及方法,其中方法包括:学习人类试错成长的方式学习末端切削力状态与机器人动作之间的关系,通过机器人力控马尔可夫决策过程问题;通过近端策略优化接触力控制;设计骨磨削动作的奖励函数与惩罚函数;对机器人动作决策策略加速训练;对影响机器人骨切削效果的因素进行分析。本发明在机器人骨切除控制过程具有马尔科夫性质的基础上,采用PPO算法来训练磨削机器人的控制器,引导机器人获得正值奖励;并行化计算和关闭图形显示有助于加快训练速度;通过协调机器人自身的强化学习策略,并结合利用人类的先验知识或PID控制算法进行引导,避免无效的探索行为实现高效的学习过程。
技术关键词
强化学习系统
力控制模块
强化学习方法
机器人力控
引入经验回放机制
子模块
决策
力传感器
分析模块
连续动作空间
磨削机器人
协调机器人
强化学习策略
强化学习算法
引导机器人
PID控制器
切削力
PID算法
系统为您推荐了相关专利信息
机器学习模型
数据收集模块
报表系统
预测系统
分布式控制系统
智能夹爪
机器人控制模块
触摸屏
机器人力控
抓取产品
智能物流配送方法
模糊逻辑控制方法
资源匹配模型
医院
最小化飞行器
深度强化学习方法
肝性脑病
置信度阈值
筛查系统
深度Q网络学习