一种基于上下文多臂机与深度强化学习的无线边缘缓存动态优化策略

正文

推荐专利

申请号：CN202411508655

申请日期：2024-10-28

公开号：CN119497152B

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开一种基于上下文多臂机与深度强化学习的无线边缘缓存动态优化策略，属于人工智能与边缘计算交叉技术领域。本发明步骤：①智慧交通场景中从基站向主基站发送从基站缓存中已缓存内容的缓存状态索引集sk；②通过DRL，主基站能够根据当前k时期的缓存状态值sk和预期折现奖励函数Q(sk,ak；θk)决定将执行的行动ak，从而得到最优的缓存替换策略③从基站根据对已缓存内容集进行更新；④从基站用CMAB算法，提取并分析用户及缓存信息的特征信息，计算每个内容的预测奖励UCB。选择使UCB值最大的内容对应的请求队列进行组播。接收用户反馈的实际奖励后，更新模型参数，以动态调整组播内容。该方法确保用户获取最新内容，提高数据实时处理能力并避免提供陈旧数据。

技术关键词

基站多臂机缓存替换策略边缘缓存网络更新模型参数动态深度强化学习算法更新系统队列索引组播系统深度Q网络年龄网络架构度量交通

系统为您推荐了相关专利信息

一种基于区块链的卫星数据动态安全共享方法及系统

基站节点地面解密共享方法

包装设计的智能生成方法、装置、计算机设备及存储介质

智能生成方法装饰特征多层感知机中间层生成包装

图神经网络与动态关系交互的图谱实体链接方法

实体链接方法实体链接模型输出特征损失函数优化更新模型参数

一种基于预训练模型微调的相似视频检索方法及存储介质

视频检索方法预训练模型样本非监督种子

一种基于深度学习大模型实现自适应对象存储数据生命周期管理的方法及系统

数据生命周期管理深度学习模型训练业务关联信息数据收集模块特征工程

一种基于上下文多臂机与深度强化学习的无线边缘缓存动态优化策略

站点导航

APP 下载