摘要
本发明提供一种面向机器人智能控制的平滑强化学习方法及装置,涉及机器人智能控制技术领域。该方法包括:获取当前时刻机器人的环境观测样本信息;根据当样本信息,构建平滑强化学习控制模型;根据样本信息,构建控制模型的奖励函数;采用机器人的离散时间运动学方程,构建控制模型的约束条件;将样本信息、奖励函数以及约束条件输入控制模型中进行在线训练,获得当前时刻机器人的平滑控制动作;构造控制模型的目标函数;根据目标函数对控制模型进更新,获得更新后的控制模型;根据平滑控制动作,获得下一时刻的观测样本信息,输入更新后的控制模型中,获得下一时刻机器人平滑控制动作。采用本发明可使机器人完成高实时且高精度的平滑控制任务。
技术关键词
机器人智能控制
学习控制模型
强化学习方法
样本
计算机可读取存储介质
机器人状态信息
阻尼器模块
周围环境信息
计算机可读指令
网络
学习设备
学习装置
强化学习策略
参数
方程
阻尼模块
系统为您推荐了相关专利信息
电磁散射参数
辨识方法
XGBoost模型
散射特征
特征值
实时检测方法
直方图
文本
数据处理程序
应急管理技术
数据智能分析方法
数控机床
异常数据点
参数
孤立森林算法
睡眠健康
睡眠监测数据
跌倒风险评估
人脸识别组件
字符
企业
样本
构建分类模型
模型训练模块
数据处理模块