一种快速控制策略收敛的深度强化学习方法

正文

推荐专利

一种快速控制策略收敛的深度强化学习方法

申请号：CN202411819313

申请日期：2024-12-11

公开号：CN119740629A

公开日期：2025-04-01

类型：发明专利

摘要

本发明属于深度学习的技术领域，具体提供了一种新的深度强化学习方法，名为DCCP(Dynamic Clipping Proximal Policy)，用于改善当前的深度强化学习算法对于某些策略控制任务无法有效地控制策略收敛的问题。本方法主要通过使用自适应的动态裁剪率和优化的损失函数表达式，起到策略收敛的效果。本方法能够防止深度强化学习神经网络提前收敛于局部最小值，鼓励策略进行积极的探索，并且在数据分布稀疏的场景，能很好地收敛。

技术关键词

深度强化学习方法深度强化学习算法控制策略超参数动态表达式数据分布样本定义网络场景

系统为您推荐了相关专利信息

一种基于高熵碳化物陶瓷不平衡数据的机器学习预测相形成能力的方法

碳化物陶瓷机器学习模型 Pearson相关系数最佳特征子集数据

一种基于区块链的分布式访问控制方法和访问控制系统

访问控制系统分布式访问控制方法访问控制策略计算机程序代码节点

一种基于YOLOv8s算法的MRI腰椎矢状位图像病症诊断方法

病症诊断方法腰椎图像检测模型生成器网络数据集制作方法

一种综合能源系统故障快速识别方法、系统、设备和介质

故障诊断模型综合能源系统故障特征动态权重分配时频分析法

带储存的智能供电系统及储存供电切换方法

智能供电系统 PD协议芯片触点组供电切换方法电源管理模块

一种快速控制策略收敛的深度强化学习方法

站点导航

APP 下载