摘要
本发明公开了一种基于双智能体强化学习的多策略自适应边缘缓存方法,其特点是该方法结合了自注意力机制与深度强化学习,通过设置两个智能体分别完成内容预测与缓存策略选择,实现了主动与被动缓存策略的协同融合,具体包括:构建边缘缓存系统模型,定义状态空间、动作空间与奖励函数;通过改进的注意力DDPG算法训练智能体以生成预测缓存列表;再由第二智能体根据系统状态从多种策略中选择最优缓存策略;从而在动态请求环境中提高缓存命中率并降低平均传输延迟。本发明与现有技术相比具有在真实与合成数据集中性能显著提升和良好的通用性与扩展性,有效解决了边缘资源分配不均和传输时延的问题,尤其适用于多用户多内容的边缘计算系统。
技术关键词
主动缓存算法
缓存策略
边缘缓存方法
列表
算法模型
边缘缓存系统
基站
上行链路功率
引入注意力机制
网络架构
深度强化学习
缓存命中率
训练智能
生成动作
服务器