摘要
本发明公开了无蜂窝大规模MIMO系统中基于嵌套DRL的高能效能源管理方法,包括:基于下行链路通信传输模型构建以最大化系统总能量效率为优化目标的优化问题;定义状态、动作和奖励在能源管理中的表示;假设功率均匀分配且无能量转移,对最大化系统总能量效率的优化问题进行拆分,得到第一子问题,并将第一子问题输出AP动态休眠操作作为已知信息传递给第二子问题,在AP动态休眠的基础上进一步优化功率分配和能量转移,以处理混合动作空间;AP根据当前的环境状态信息采用由PPO网络和SAC网络组成的嵌套的深度强化学习算法在动态和不确定环境中自适应调整功率分配、能量转移与动态休眠。本发明在满足用户通信可靠性和实时性需求的同时,提升了系统总能效。
技术关键词
大规模MIMO系统
能源管理方法
最大化系统
环境状态信息
能效
深度强化学习算法
嵌套
下行链路通信
统计信道状态信息
动态
功率
连续动作空间
SAC算法
启发式方法
速率
决策
定义
策略更新
系统为您推荐了相关专利信息
NOMA系统
拓扑优化方法
最大化系统
禁忌搜索算法
聚类机制
能效评估模型
能效评估系统
光储充
放电效能
储能
风机过滤单元
仓储装置
虚拟三维模型
存储组件
环境状态信息