摘要
本发明公开一种局部观测下异构无人机协同追捕规划方法与系统,旨在解决异构无人机群体因局部观测信息不完整、稀疏奖励导致的探索效率低下问题。其构建含侦察与追捕无人机的异构决策环境,明确前者依托广感知、高机动特性搜索目标并传信,后者依信息执行合围拦截的分工;为两类无人机设计基于局部观测的独立状态与决策级动作空间。核心是引入随机网络蒸馏机制,通过可训练预测网络与固定随机目标网络的预测误差生成探索奖励,克服奖励稀疏难题;采用多智能体双延迟深度确定性策略梯度算法框架优化协同策略。通过融合探索与外在任务奖励,无人机群仅依赖局部信息即可实现高效鲁棒的协同追捕决策,提升复杂环境下任务成功率与智能化水平。
技术关键词
异构无人机
侦察无人机
网络
决策
强化学习算法
策略
规划系统
静态障碍物
算法框架
梯度下降法
蒸馏
模块
预测误差
速度
机制