摘要
本发明提供一种数字孪生辅助的流量感知无蜂窝MIMO波束选择方法,包括数字孪生模块和强化学习(Reinforcement Learning,RL)波束选择模块,实现步骤为:算法部署初期,采用专家策略进行波束选择,并将每次观测到的环境信息放入数据仓库中;当收集足够的环境信息样本后,构建并监督训练数字孪生模块,作为虚拟环境与RL波束选择模块进行离线交互,提供RL训练所需的状态和奖励信息;当训练一定轮数后,将RL波束选择模块部署在真实环境中,从而替代专家策略,与现有RL波束选择方案相比,此数字孪生辅助方案避免了探索初期的不安全,具有更高的初始性能和更快的收敛速度。
技术关键词
数字孪生
波束
流量生成器
模块
信道预测器
模拟真实环境
队列
协作基站
离线
策略
索引
样本
定义
决策
级联
算法
网络
模式