摘要
本发明涉及无人飞行器技术领域,公开了一种基于博弈理论的无人飞行器目标追踪方法,包括:建立无人机数学模型;利用无人机数学模型,定义博弈均衡点;基于上述定义,定义奖励函数;基于SAC架构设计策略网络和价值网络;在无人机平台上部署智能体网络,无人机根据环境于自身状态提取状态信息作为策略网络输入,生成每个时刻的无人机动作决策,并控制无人机追踪目标。本发明发挥了多无人机追逃单无人机优势,结合复杂场景、多目标和多约束等,实现多无人机快速地追捕非合作单个无人机应用。本发明选择SAC作为AC架构的深度强化学习算法,并将策略的熵写入值函数,增强了策略的探索性,在许多任务中具有更加优秀的表现。
技术关键词
无人机数学模型
追踪方法
网络
无人机平台
定义
控制无人机
策略
深度强化学习算法
无人飞行器技术
理论
多无人机
速度
决策
连线
场景
关系
运动
系统为您推荐了相关专利信息
重启方法
神经网络模型
状态检测单元
离线
电力终端设备
机器学习模型
PageRank算法
回归分析法
网络
拷贝数
无人机相机
BIM技术
建筑物
无人机航线
巡检方法
生成对抗网络训练
故障检测系统
电流特征提取
多模态
频域特征
地图
数据处理方法
计算机可读指令
存储模组
电源模组