摘要
本发明公开一种基于深度强化学习的多无人机路径规划、频谱和功率分配方法及系统,涉及无人机技术领域。方法包括以下步骤:S1、构建系统模型,包括飞行模型、路径损耗模型和通信模型;S2、构建强化学习框架,包括定义强化学习RL元素和联合路径规划与资源分配Q网络框架;S3、基于损失计算梯度,并通过决策网络进行反向传播;对决策网络和价值网络的权重进行更新,以最小化损失;经过更新的决策网络产生改进策略,指导无人机进行动作;决策网络持续学习以最大化预期的累积奖励,从而实现多无人机路径的规划、频谱和功率的分配。本发明实现了多无人机任务时路径、频谱及功率高效协同,提升系统性能,具广泛应用前景。
技术关键词
无人机路径规划
功率分配方法
深度强化学习
路径损耗模型
强化学习框架
飞行模型
网络
决策
构建系统模型
多无人机
资源分配
功率分配系统
建立通信链路
元素
无人机技术
障碍物
系统为您推荐了相关专利信息
数据集成平台
动态管理方法
调控策略
动态管理系统
材料管理系统
强化学习环境
三维内窥镜
多智能体强化学习
深度强化学习
强化学习模型
故障容错控制
健康状态评估方法
数字孪生
长短期记忆神经网络
多尺度
农机变速箱
防错系统
视觉检测单元
数据采集模块
警示装置
分布式发电机
配电网电压控制
切换电容器
配电网系统
有功功率