缓存决策模型训练方法、装置、设备、介质及程序产品

正文

推荐专利

申请号：CN202411866440

申请日期：2024-12-18

公开号：CN119740677A

公开日期：2025-04-01

类型：发明专利

摘要

本申请提供一种缓存决策模型训练方法、装置、设备、介质及程序产品，涉及量子技术领域，包括：根据缓存决策模型状态空间、动作空间、奖励函数，通过量子搜索算法，以强化学习算法贝尔曼方程迭代计算每个历史请求状态下，每个缓存动作对应的累积奖励值，直到缓存决策模型收敛，其中在当前迭代回合中执行第一历史请求状态下的一个目标缓存动作的情况下：若当前迭代回合目标缓存动作对应的累积奖励值大于或等于上一迭代回合第一历史请求状态下所有的缓存动作对应的最大累积奖励值，则通过量子操作提高选择目标缓存动作的概率。本申请的方法利用量子搜索算法，提高后续选择好动作的概率以加快强化学习算法的收敛速度，降低缓存决策模型的训练时间。

技术关键词

决策模型训练方法缓存决策方法强化学习算法时延基站数据计算机执行指令搜索算法周期量子纠缠态方程模型训练装置可读存储介质计算机程序产品处理器通信存储器电子设备

系统为您推荐了相关专利信息

一种基于物联网的IC卡账户消费管理方法及系统

消费管理方法账户 IC卡消费管理系统认证机制

一种专网蜂窝组网的空口加密方法

空口加密方法专网加密传输机制组网双向认证机制

一种5G基站智慧防水系统及方法

5G基站关键环境参数基站机柜防水系统环境监测模块

基于多模态信息的无人机波束预测方法及装置

多模态信息无人机波束成形神经网络模型特征选择

铁路信号数据仿真方法、装置、设备、存储介质及产品

移动基站数据仿真方法信号载干比仿真模型采样点

缓存决策模型训练方法、装置、设备、介质及程序产品

站点导航

APP 下载