摘要
本发明公开了一种基于空间聚类与深度强化学习的未知环境目标搜索方法及系统,涉及多目标搜索技术领域,首先基于维诺图的空间聚类方法,根据搜索无人机的初始位置以及区域安全等级,将三维动态环境划分为与无人机数量相等的任务区域分配给搜索无人机;模拟目标与动态障碍物的运动,基于环境反馈构建奖励函数,并基于搜索任务构建数学模型;基于神经网络近似法,得到搜索无人机的搜索策略;基于马尔科夫决策过程与梯度上升法,通过最大化搜索无人机的期望累积奖励,获取搜索无人机的最优搜索策略。本发明使得所有搜索无人机得以最短的时间和最低的成本安全地搜索出三维环境中的全部目标,提高了搜索无人机在大范围空域的目标搜索能力。
技术关键词
搜索无人机
深度强化学习
搜索方法
空间聚类方法
动态障碍物
构建数学模型
策略
机载雷达
静态障碍物
处理器模块
决策
轨迹
构建算法
搜索技术
搜索系统
坐标
系统为您推荐了相关专利信息
心室辅助装置
深度强化学习模型
主动脉
仿真平台
波形
工程建设项目
管理方法
数字孪生模型
生成工程
图谱
深度强化学习模型
学习系统
多模态
模糊PID控制
油液金属颗粒
扩展卡尔曼滤波器
全局路径规划
激光雷达
粒子
静态障碍物
决策方法
粒子群优化算法
Lyapunov指数
深度强化学习模型
深度强化学习算法