摘要
本发明涉及一种基于有模型深度强化学习的卫星远距离交会对接控制方法,其特征在于:远距离交会对接任务场景中存在的两颗卫星初始距离在100km以上,期望使用单一稳定的控制策略控制工作星接近目标星,最终将两颗卫星的距离降低到5m以内,且最终相对速度不高于0.5m/s,通过将卫星远距离交会对接任务建模为部分可观测马尔可夫决策过程,并利用专家数据和世界模型,通过有模型深度强化学习算法训练上述交会对接场景的控制策略,在此基础上,降低训练得到有效策略的时间,并提高策略控制交会对接的成功率。
技术关键词
对接控制方法
远距离
控制策略
深度强化学习算法
决策
坐标系
轨迹
速度
笛卡尔
阶段
解码器
场景
代表
编码器
数据
符号
系统为您推荐了相关专利信息
宏微工作台
高精度定位方法
激光干涉仪
多自由度运动
高精度恒温箱
智能风险控制
金融
模块
循环神经网络模型
构建用户画像
混合预测方法
互补集合经验模态分解
深度信念网络
深度神经网络
电力负荷预测