一种基于多智能体强化学习的无人机资源分配方法、系统、设备及介质

正文

推荐专利

申请号：CN202411903606

申请日期：2024-12-23

公开号：CN119767328A

公开日期：2025-04-04

类型：发明专利

摘要

一种基于多智能体强化学习的无人机资源分配方法、系统、设备及介质，方法为：为多模态无人机协助的通感一体化的数据服务场景建立数据服务场景下多无人机资源分配的多目标优化问题，设计平均峰值信息年龄、累计数据服务量和无人机能耗评价指标；将多目标优化问题表述为马尔可夫决策问题，设计状态空间、动作空间及相应的即时奖励函数；通过设计离散actor网络和连续actor网络，得到混合动作空间的多智能体TD3算法，即MAHTD3算法，根据马尔可夫决策模型，使用MAHTD3算法训练更新无人机的网络参数，将训练得到的无人机应用到数据服务场景中进行通信资源分配；系统、设备及介质用于实现该方法；本发明能更好地满足随机动态的通感一体化场景下地面用户数据服务需求。

技术关键词

多智能体强化学习无人机资源分配通信资源分配设计无人机通信链路网络算法模式雷达场景年龄能耗定位地面用户指标载波决策功率

系统为您推荐了相关专利信息

低轨卫星通信中大频偏估计处理方法和通信系统

卫星终端系统通信链路参数通信系统可读存储介质

整机柜服务器管理系统、方法、设备及介质

硬件设备整机柜服务器管理电源管理模块背板总线管理系统

一种基于cpu+gpu的张量并行计算大模型的算法

协同计算机动态资源分配负载均衡策略通信等待时间环形算法

基于DDS的飞机机翼部段测试方法及系统

测试平台测试模块飞机机翼数字孪生模型智能故障诊断

一种基于多智能体强化学习的物流全流程优化系统及其优化方法

多智能体强化学习智能体模型强化学习算法多源异构数据场景

一种基于多智能体强化学习的无人机资源分配方法、系统、设备及介质

站点导航

APP 下载