摘要
本申请涉及无人机自主决策技术领域,提供一种基于多目标优化的无人机自主决策强化学习方法、系统、设备及存储介质,解决无人机动态任务分配能力有限、决策能力差的问题。本申请方法包括:基于红外数据和雷达数据,生成可疑目标在目标区域内的移动轨迹预测序列,构建移动概率热力图,目标区域包括已巡查区域;对雷达数据进行多普勒频移分析,生成目标速度矢量场;结合无人机的位置数据,通过区域重划分强化学习模型基于用于多目标优化的奖励函数,输出包含未巡查区域的动态分割方案的无人机自主决策强化学习结果,奖励函数用于体现区域覆盖率最大化、目标追踪成功概率最大化及路径能耗最小化。本申请实现了无人机对未巡查区域的自主智能决策。
技术关键词
无人机
强化学习模型
强化学习方法
热力图
轨迹
多普勒
雷达
坐标
数据
动态
序列
机载传感器
速度
自主智能决策
自主决策技术
覆盖率
方位角
强化学习系统
存储组件
系统为您推荐了相关专利信息
阶段
图像块
多尺度语义特征
无人机影像数据
网格
运输机器人
智能电梯
无人机
机器人充电模块
信息处理模块