一种在线多步启发式动态规划方法、介质及设备

正文

推荐专利

申请号：CN202510448675

申请日期：2025-04-10

公开号：CN120406117A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种在线多步启发式动态规划方法、介质及设备，属于非线性系统控制领域，包括：针对非线性仿射系统，开发了一种在线多步启发式动态规划方法。通过结合行动者批判网络和经验回放技术，提高了学习速度，并能够在不依赖可接受控制条件的前提下实现更高效的策略评估。为了增强学习过程中数据的多样性，提出了一种融入ER技术的执行评判神经网络结构，使得代理能够在更少的样本上进行有效探索，从而减少了对训练数据的依赖。最后，通过仿真结果验证了所提算法的优越性，实验表明，在相同条件下，ER‑MSHDP算法相比传统HDP算法具有更快的学习进程，且随着步长增大，学习时间呈指数级下降。

技术关键词

启发式动态规划估计误差神经网络结构在线非线性系统控制近似误差函数获取方法定义动态规划方法控制策略重放技术回放技术处理器梯度下降法稳定系统迭代方法更新系统

系统为您推荐了相关专利信息

一种集成在模切机上的刀模刃口检测方法

光学检测模组模切机磨损特征刃口刀模

融合自监督学习和知识图谱的恶意指令检测方法及系统

动态知识图谱指令更新知识图谱样本损失函数优化

一种密封件密封性能在线检测方法

在线检测方法相场模型密封件条形码压力传感器阵列

一种多节伸缩精密升降杆及位置控制方法

位置控制方法力矩内管联动机构联动齿轮

一种非物质文化遗产数字化保护系统和方法

非物质文化遗产数字化保护系统子模块手工艺品民间艺术

一种在线多步启发式动态规划方法、介质及设备

站点导航

APP 下载