摘要
本发明提供了一种基于深度强化学习的无人机资源分配优化方法及系统,对应用场景建模,计算整个模型的吞吐量,以吞吐量最大化为目标函数,制定路径轨迹优化及功率分配优化的联合资源优化问题;利用聚类算法对用户终端进行分簇,且在分簇过程中,考虑无人机的用户容量限制;构建并训练深度强化学习模型,所述深度强化学习模型引入对偶架构以获得值函数和优势函数,并在训练过程中,引入目标网络,且目标网络参数和主网络参数协同更新;利用训练后的深度强化学习模型进行联合优化问题的求解,得到最终的路径轨迹优化及功率分配优化策略。本发明可以智能地实现UAV飞行轨迹和分配功率资源,大大提高了系统的吞吐量和用户的QoS满意度。
技术关键词
无人机资源分配
深度强化学习模型
联合资源优化
终端
聚类算法
网络
参数
场景
服务质量约束
轨迹
功率
多址接入技术
干扰噪声比
正交频分复用
决策
信道
策略
系统为您推荐了相关专利信息
焊接缺陷检测方法
焊缝缺陷检测
DBSCAN聚类算法
卷积模块
注意力机制
电池容量预测方法
序列
测试电池
多尺度
ARIMA模型
风电齿轮箱
无线温度传感器
温度可视化方法
齿轮箱温度
无线温度记录仪