摘要
一种基于多智能体强化学习的无人机资源分配方法、系统、设备及介质,方法为:为多模态无人机协助的通感一体化的数据服务场景建立数据服务场景下多无人机资源分配的多目标优化问题,设计平均峰值信息年龄、累计数据服务量和无人机能耗评价指标;将多目标优化问题表述为马尔可夫决策问题,设计状态空间、动作空间及相应的即时奖励函数;通过设计离散actor网络和连续actor网络,得到混合动作空间的多智能体TD3算法,即MAHTD3算法,根据马尔可夫决策模型,使用MAHTD3算法训练更新无人机的网络参数,将训练得到的无人机应用到数据服务场景中进行通信资源分配;系统、设备及介质用于实现该方法;本发明能更好地满足随机动态的通感一体化场景下地面用户数据服务需求。
技术关键词
多智能体强化学习
无人机资源分配
通信资源分配
设计无人机
通信链路
网络
算法
模式
雷达
场景
年龄
能耗
定位地面用户
指标
载波
决策
功率
系统为您推荐了相关专利信息
卫星终端系统
通信链路
参数
通信系统
可读存储介质
硬件设备
整机柜服务器管理
电源管理模块
背板总线
管理系统
协同计算机
动态资源分配
负载均衡策略
通信等待时间
环形算法
测试平台
测试模块
飞机机翼
数字孪生模型
智能故障诊断
多智能体强化学习
智能体模型
强化学习算法
多源异构数据
场景