摘要
本发明公开了一种基于离线‑在线深度强化学习的NDN缓存策略,涉及命名数据网络领域,包括步骤:在NDN网络的路由器内增加兴趣请求表;提取缓存日志数据;使用自注意力机制动态分配各属性权重;离线训练,提取最优缓存策略;使用IQL模型在线微调模块对策略调优;周期性的执行在线微调模块。本发明针对真实拓扑TISCALI进行了大规模的仿真,与现有典型缓存策略相比,本发明能够明显提高网络中的整体缓存命中率、降低时延、降低链路拉伸率以及提高用户体验。
技术关键词
缓存策略
深度强化学习
离线
在线
注意力机制
神经网络参数
命名数据网络
路由器
缓存命中率
兴趣
贪婪算法
日志
周期性
模块
时延
链路
系统为您推荐了相关专利信息
车载空调控制方法
深度强化学习模型
控制策略
公共汽车
车载空调控制模块
语音欺骗检测
语音识别模型
音频
注意力机制
分类器
风暴潮漫滩
智能预报方法
多头注意力机制
图像块
多层感知机
井下设备
特征提取模型
故障诊断方法
记忆单元
分类器模型