摘要
本发明公开了一种复杂动态环境下的多飞艇协同飞行控制方法,属于位置和航道控制技术领域。复杂动态环境下的多飞艇协同飞行控制方法,包括以下步骤:搭建复杂动态环境下多飞艇路径规划的部分可观测马尔可夫决策模型;提出集中式训练、分布式决策的多飞艇强化学习方法;基于距离加权平均域方法构建飞艇的扩展观测;基于不确定性的训练优化方法预测低不确定性区域,并在策略训练过程中对每个飞艇进行多步值收敛。本发明通过距离加权平均场方法设计了扩展观测,有效地整合来自邻近飞艇的信息;建立虚拟环境模型量化不确定性,预测低不确定性区域,并在策略训练过程中对每个飞艇进行多步值收敛,促进了稳定高效的学习。
技术关键词
飞艇
协同飞行控制方法
强化学习方法
训练优化方法
流体动力学系统
动态
航道控制技术
虚拟环境模型
网络
决策
策略
规划
参数
变量
累积误差
因子
球形
表达式
邻居
数学