摘要
本发明公开了一种在重传系统以及移动环境中进行链路自适应的方法,其特征在于,包括:构建并初始化强化学习神经网络;获取信息,信息包括当前用户反馈的信道状况信息和HARQ进程信息;监测信道环境是否切换;根据信息构建观测状态向量;将观测状态向量输入强化学习神经网络,输出当前HARQ进程对应的MCS;向用户传输包含MCS的数据包并接收用户的反馈信息;根据反馈信息判断当前HARQ进程是否结束,若是,则计算当前HARQ进程的重传折算吞吐奖励,并进行状态、动作、奖励对齐整合后存入经验池之后进入后续步骤;根据若干条经验数据基于梯度下降法训练强化学习神经网络。本发明解决了传统算法无法适应实际5G网络以及复杂多变环境中的问题。
技术关键词
重传系统
进程
链路
信道
网络
梯度下降法
门控循环单元
策略
滤波
复杂多变环境
数据
决策
重构
场景
键值
字典
因子
算法
周期性