摘要
本申请提供了一种基于多智能体强化学习的卫星协同跟瞄运动目标方法及系统,该方法包括:在每颗卫星上装载训练好的策略网络,并初始化交互场景;构造卫星的局部观测,输入策略网络,输出每个时刻的卫星跟瞄动作;所述策略网络包括并行的卷积通道和全连接通道;所述卷积通道和全连接通道在特征维度拼接后,经融合层输出动作概率分布,根据概率采样得到卫星跟瞄动作。本申请的优势在于:响应时延显著缩短;跟踪连续性和精度提高;能耗与机动安全性受控;良好的可扩展性与容错性。
技术关键词
多智能体强化学习
姿态误差
策略
网络
控制力矩
通道
运动
场景
敏捷卫星
表达式
能耗
参数
精度
取向
连续性
异构
时延
变量
轨迹
算法