摘要
本发明公开了基于进化算法和强化学习的航天器形态控制方法及系统,具体为:S1.建立初始种群,种群中的个体为不同功能模块和不同模块数量组合的不同形态的航天器;S2.对种群中的所有个体进行内环初始化学习训练,计算每个个体的适应度值;S3.选择适应度值较高的个体组成精英种群;S4.利用遗传算法中的遗传和变异操作,对精英种群进行均匀交叉、单点变异,生成精英子代;S5.内环强化学习:对步骤S4中获得精英子代进行学习训练;S6.形态评估;S7.形成最优个体。本发明充分结合空间环境和任务需求的特点,基于深度进化强化学习的内外环算法架构,通过外环形态进化和内环学习训练不断交替,实现模块化航天器的形态自主生成。
技术关键词
形态控制方法
进化算法
内环
Actor模型
精英遗传算法
模块化航天器
航天器构型
场景
功能模块
算法架构
执行器
进程
网络
控制策略
参数