深度强化学习模型的更新方法及装置

正文

推荐专利

深度强化学习模型的更新方法及装置

申请号：CN202510368443

申请日期：2025-03-27

公开号：CN119902789A

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了深度强化学习模型的更新方法及装置，属于深度强化学习模型技术类领域，该深度强化学习模型的更新方法及装置，包括下述具体步骤：步骤一：通过多个并行执行单元异步采集环境交互数据；步骤二：基于动态优先级策略从经验池中采样数据，所述优先级由TD‑error和策略相似度联合确定；步骤三：采用分层更新策略，对网络的关键层与非关键层设置不同更新频率；步骤四：通过软更新技术逐步同步目标网络与在线网络参数。本发明通过异步更新机制减少等待时间，提高资源利用率，使效率提升，通过动态优先级采样使训练速度提升，加速收敛，分块更新策略降低计算开销，节省资源，通过对抗测试的模型错误率降低，提高安全性。

技术关键词

深度强化学习模型更新方法传感器获取环境数据采集模块校验模块神经网络参数动态策略更新频率分层在线分块错误率时序表达式误差

系统为您推荐了相关专利信息

一种整体叶盘等效气动弹性试验系统

整体叶盘激振器电涡流位移传感器电涡流传感器结构系统

基于随机森林模型的内存故障维护系统及方法、电子设备、存储介质、计算机程序产品

随机森林模型内存动态可视化数据采集模块可视化参数

一种应用于肿瘤内科的健康相关信息处理系统

信息处理系统自然语言生成技术内科临床决策支持肿瘤

一种基于数字孪生技术的三维视频融合方法及系统

视频融合方法数字孪生技术数字孪生模型图像采集设备异常事件

电池健康状态估计模型构建方法、状态估计方法及装置

电池健康状态关系模型构建方法恒功率状态估计方法

深度强化学习模型的更新方法及装置

站点导航

APP 下载