摘要
本发明提出了一种基于模型辅助强化学习的空间机器人目标捕获方法,包括:步骤1:推导出空间自由飞行机器人系统的动力学约束并搭建环境模型;步骤2:设置合适的参数和目标函数进行无模型强化学习训练;步骤3:设计深度拉格朗日神经网络框架并训练出系统动力学模型,并得出状态转移模型;步骤4:以步骤2的参数为参照,加入步骤3得到的状态转移模型进行模型生成虚拟经验来辅助完成强化学习训练过程。本发明可提升强化学习的样本效率,收敛速度和训练出抓取移动目标的控制器模型的快速性和准确性;整体逻辑与原理清晰简单,适用于不同的系统和各种工况,具有较强的泛化性;用深度拉格朗日神经网络使得状态转移模型具有可靠性。
技术关键词
空间机器人
捕获方法
状态转移模型
飞行机器人系统
系统动力学模型
神经网络框架
参数
拉格朗日方程
强化学习方法
控制策略
末端执行器
科里奥利
变量
控制器
定义
力矩
数据
系统为您推荐了相关专利信息
可视化交互方法
可视化交互装置
构建状态转移模型
动态可视化
融合多源数据
状态转移模型
中央处理器
损失函数优化
动态
资源
飞行状态数据
四旋翼无人机
电机故障状态
深度学习模型
构建深度神经网络
交互式多模型滤波
扩展卡尔曼滤波
跟踪方法
样条
方位角