摘要
本发明公开了一种基于深度强化学习的动态缓冲区大小调整方法,包括:构建Dueling DQN模型和经验回放池,将网络状态依次经过两层全连接层提取特征,通过自注意力机制进行注意力权重分配,再经过噪声层引入噪声扰动;采用动作优势网络对智能体所能采取的动作进行评估,采用状态价值网络对网络状态进行评估,获得网络的Q值并执行动作,基于反馈的奖励以及下一时刻网络状态,构成网络环境样本存入经验回放池中;抽取网络环境样本训练Dueling DQN模型;本发明所设计的方法通过强化学习算法,在不同流量负载和网络状态下,动态调整缓冲区大小减少抖动和延迟,从而有效提高网络的传输性能,提升服务质量。
技术关键词
深度强化学习
网络状态映射
样本
噪声
注意力机制
动态权重分配
强化学习算法
参数
策略更新
矩阵
传播算法
定义
时延
队列
误差
数据
系统为您推荐了相关专利信息
时序预测模型
图谱
多层神经网络模型
作物管理技术
实体
药品识别
复核方法
字符识别模型
图像识别模型
样本
多智能体深度强化学习
强化学习算法
智能无人机
机载计算机
神经网络参数