摘要
本发明涉及一种多无人机组网的频谱资源分配与功率控制方法及系统。所述方法包括:构建通信资源分配模型。将U2U通信链路的动态观测值作为智能体,每个智能体通过通信资源分配模型采用马尔可夫决策算法生成的局部观测函数进行集中学习,根据当前迭代步智能体的观测值获取对应的信道状态与数据包传输行动,并基于强化学习与优化后的奖励函数获取全局奖励值,根据全局奖励值分别生成信道与功率联合分配策略。将全部智能体的信道状态与数据包传输行动组成全局资源分配行动集合,集合与下一迭代步智能体的本地观测值作为下一迭代步的状态输入至模型进行迭代学习,输出最优分配策略。采用本方法能够提高多无人机在有限通信资源下的作业灵活性和效率。
技术关键词
通信资源分配
通信链路
全局资源分配
多无人机
信道
功率控制策略
决策算法
地面站
功率控制方法
深度Q网络
资源共享
组网
损耗
动态
功率控制系统
系统为您推荐了相关专利信息
功率分配方法
充电终端
车辆接口
大功率
功率分配系统
一体化传输系统
波束成形向量
信道状态信息
速率
信噪比