摘要
本发明涉及一种无蜂窝大规模MIMO系统基于深度强化学习的AP同步方法,属于无线通信系统领域。通过构建系统模型、状态空间、动作空间和奖励函数,并采用深度确定性策略梯度算法DDPG训练代理模型,实现了对AP时频偏差的实时补偿和优化。该方法通过代理模型根据当前状态选择最佳动作,以总频谱效率增益为奖励,不断学习并调整AP的时频偏差补偿因子,同时利用SINR感知技术计算总频谱效率,从而显著提高了无蜂窝大规模MIMO系统的同步精度和频谱效率,优化了网络性能,适用于未来高密度、高容量无线通信网络的需求。
技术关键词
大规模MIMO系统
深度强化学习
同步方法
偏差
信道
因子
构建系统模型
无线通信网络
算法
无线通信系统
提升系统
定义
天线
高密度
信号
策略
精度
数据
系统为您推荐了相关专利信息
蚁群优化算法
信道参数估计方法
信道冲激响应
蚂蚁
时延
电熔镁炉
调频
集中控制架构
优化调控模型
协调控制方法
电商
电力
深度强化学习算法
模糊隶属度函数
学习训练方法