基于VPPO算法的无小区多输入输出环境的缓存优化方法

正文

推荐专利

申请号：CN202511083686

申请日期：2025-08-04

公开号：CN120957192A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开一种基于VPPO算法的无小区多输入输出环境的缓存优化方法，涉及边缘缓存优化技术领域。生成多个独立的环境实例且并行运行；基于多个独立的环境实例和价值网络对策略网络进行训练，得到训练完成的策略网络；将当前边缘服务器的缓存比例输入训练完成的策略网络，得到边缘服务器的缓存比例的调整。采用多环境并行交互模拟复杂动态场景，并行采集多场景数据，提升模型对动态变化的适应和决策能力。用Retrace优势估计适配非马尔可夫环境，通过截断权重和递归计算，处理状态转移依赖历史的情况，解决传统优势估计在这类场景的偏差问题，让优势函数计算更准，为策略优化打基础，提升模型在复杂依赖关系场景的性能。

技术关键词

缓存优化方法策略网络服务器小区算法缓存优化技术延迟参数智能设备轨迹处理器生成智能指令动态场景计算机程序产品多环境数据多场景

系统为您推荐了相关专利信息

一种基于大数据的工业设备健康评估系统及方法

健康评估系统健康评估方法工业设备数字孪生模型样本

一种通信异常智能化诊断方法、装置、电子设备及系统

通信组件智能化诊断方法错误码特征提取模型存储设备

面向空间光通信的分集接收光子芯片

光子芯片光栅分束器网络波导

一种基于YOLO算法的轻量化检测方法

YOLO算法网络结构注意力卷积模块归一化方法

一种基于视觉AI技术的IDC机房异常检测方法及系统

AI算法异常检测方法视觉告警模块图像

基于VPPO算法的无小区多输入输出环境的缓存优化方法

站点导航

APP 下载