一种基于上下文多臂机与深度强化学习的无线边缘缓存动态优化策略

AITNT
正文
推荐专利
一种基于上下文多臂机与深度强化学习的无线边缘缓存动态优化策略
申请号:CN202411508655
申请日期:2024-10-28
公开号:CN119497152B
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开一种基于上下文多臂机与深度强化学习的无线边缘缓存动态优化策略,属于人工智能与边缘计算交叉技术领域。本发明步骤:①智慧交通场景中从基站向主基站发送从基站缓存中已缓存内容的缓存状态索引集sk;②通过DRL,主基站能够根据当前k时期的缓存状态值sk和预期折现奖励函数Q(sk,ak;θk)决定将执行的行动ak,从而得到最优的缓存替换策略③从基站根据对已缓存内容集进行更新;④从基站用CMAB算法,提取并分析用户及缓存信息的特征信息,计算每个内容的预测奖励UCB。选择使UCB值最大的内容对应的请求队列进行组播。接收用户反馈的实际奖励后,更新模型参数,以动态调整组播内容。该方法确保用户获取最新内容,提高数据实时处理能力并避免提供陈旧数据。
技术关键词
基站 多臂机 缓存替换策略 边缘缓存网络 更新模型参数 动态 深度强化学习算法 更新系统 队列 索引 组播系统 深度Q网络 年龄 网络架构 度量 交通
系统为您推荐了相关专利信息
1
一种基于区块链的卫星数据动态安全共享方法及系统
基站 节点 地面 解密 共享方法
2
包装设计的智能生成方法、装置、计算机设备及存储介质
智能生成方法 装饰特征 多层感知机 中间层 生成包装
3
图神经网络与动态关系交互的图谱实体链接方法
实体链接方法 实体链接模型 输出特征 损失函数优化 更新模型参数
4
一种基于预训练模型微调的相似视频检索方法及存储介质
视频检索方法 预训练模型 样本 非监督 种子
5
一种基于深度学习大模型实现自适应对象存储数据生命周期管理的方法及系统
数据生命周期管理 深度学习模型训练 业务关联信息 数据收集模块 特征工程
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号