一种应用于强化学习决策模型的重放比率调整方法

正文

推荐专利

申请号：CN202411120215

申请日期：2024-08-15

公开号：CN119005291A

公开日期：2024-11-22

类型：发明专利

摘要

本发明公开了一种应用于强化学习决策模型的重放比率调整方法，该方法包括：对当前重放缓冲区内的样本数据进行随机采样，确定当前训练样本，其中，当前重放缓冲区对应于当前重放比率，当前重放比率为新样本与旧样本的数量比值；基于当前训练样本对强化学习决策模型进行训练，以确定当前性能反馈参数；若当前训练轮次满足预设重放比率调整条件，则基于当前性能反馈参数、当前重放比率以及至少一种预先设置的重放比率调整策略，确定与重放缓冲区对应的目标重放比率，以基于目标重放比率对当前重放缓冲区进行样本更新，通过动态调整重放比率以平衡新鲜经验的写入重放缓冲区的速度，提高了强化学习决策模型算法的学习效率和最终策略性能。

技术关键词

比率决策样本参数策略模型算法数据动态关系速度

系统为您推荐了相关专利信息

一种多模态数字细胞基础模型的构建方法

结点基因调控网络基础数据消息传递机制

面向AI业务增强的无线接口协议栈架构、数据传输方法

信令无线接口协议无线资源控制层数据传输方法人工智能决策

服务推荐方法、装置、电子设备及计算机程序产品

融合特征情景服务推荐方法情感反馈画像模型

一种打钻过程自动分类录像方法及系统

视频帧视频流录像设备录像方法深度神经网络模型

一种基于土石方分布的动态网格划分方法

三维地质模型复杂度动态网格数据网格划分方法

一种应用于强化学习决策模型的重放比率调整方法

站点导航

APP 下载