摘要
本发明涉及一种基于深度强化学习的低空智联网动态频谱分配和接入方法及系统,包括:S1、构建低空智联网的无人机网络;S2、每个无人机搭载一个actor‑critic网络,在actor‑critic网络中引入最大熵方法进行优化,形成MAEAC强化学习模型;S3、训练MAEAC强化学习模型,得到训练好的MAEAC强化学习模型,获取频谱分配与接入的最优策略。本发明提供了一种基于深度强化学习的低空智联网动态频谱分配和接入方法及系统,该算法通过添加熵项执行策略的更新,增加了策略的随机性并加快了收敛速度,解决了低空智联网中无人机网络需在有限的频谱资源下如何实现稳定通信的问题,并取得良好的效果。
技术关键词
无人机
强化学习模型
动态频谱分配
深度强化学习
信道
策略
参数
强化学习算法
因子
内存
处理器
网络结构
计算机设备
可读存储介质
动态地
存储器
模块
标记
系统为您推荐了相关专利信息
多路径
数字高程模型
路径规划算法
路径规划方法
叠加算法
智能分析平台
云端数据中心
巡检方法
地面控制站
无人机平台
自主空中加油
图像嵌入
掩膜
视觉
交叉注意力机制
地面控制站
无人机航线
无人机设备
颜色
风险评估模型
AD采集模块
接收设备
射频模块
分析工具
加密模块