摘要
本申请提供一种基于深度强化学习的蜂窝网络功率控制方法及装置,涉及通信技术领域。其中方法包括:基于双延迟深度确定性策略梯度算法构建强化学习模型,获取蜂窝网络中目标基站在当前时隙的状态,所述状态包括:前一时隙中目标基站向目标用户发射信号的发射功率和信号传输速率,以及当前时隙中目标用户的目标干扰信息集合;将所述当前时隙的状态输入到训练好的强化学习模型中,得到所述强化学习模型决策出的下一时隙中目标基站向目标用户发射信号的发射功率。可见,本申请基于双延迟深度确定性策略梯度算法构建强化学习模型来决策基站的发射功率,能够在最大发射功率的约束下使蜂窝网络的和速率最大化,提高了蜂窝网络用户的服务质量。
技术关键词
强化学习模型
网络功率控制方法
深度强化学习
基站
计算机可读指令
功率控制装置
参数
决策
信号
训练样本集
生成动作
处理器
网络用户
算法
可读存储介质
模块
存储器
策略
系统为您推荐了相关专利信息
移动机器人避障
多模态信息融合
策略优化方法
SAC算法
多模态融合方法
定位测量方法
计算机执行指令
实体
消息
生命周期管理
无线网络规划方法
高速动车组
小区重叠区域
基站
概率密度函数
图像分类模型
计算机可读指令
图像匹配
图像特征提取
训练样本图像