摘要
本发明提供了一种基于强化学习和自注意力机制的无人机冲突解脱方法,包括:首先,将无人机与空域之间的动态关系建模为强化学习中智能体与环境之间的交互过程。然后,设计智能体的动作空间、观测空间和奖励函数,搭建基于强化学习的冲突解脱训练框架;最后,基于自注意力机制的设计无人机注意力模型,其中包括用于提取动态环境中无人机位置与冲突特征的编码器,以及利用自回归方式生成无人机冲突解脱动作的译码器。本发明设计了一种新的无人机自由飞行冲突解脱方法,可以对空域飞行的多架无人机进行合理的联合动作分配,完成冲突解脱保障飞行安全。
技术关键词
注意力机制
注意力模型
设计无人机
解码器
编码器
飞行冲突解脱方法
生成无人机
交互模型
强化学习方法
强化学习算法
构建无人机
速度
关系建模
决策
动态
参数
策略
机体
系统为您推荐了相关专利信息
储量预测方法
决策树模型
植被指数信息
随机森林
基准特征
时空数据可视化
多模态
热力图
可视化界面
建立决策树
锅炉运行参数
深度学习预测模型
氧气需求量
局部特征信息
注意力机制
K近邻方法
样本
无监督聚类方法
预训练模型
解码器