一种在线多步启发式动态规划方法、介质及设备

AITNT
正文
推荐专利
一种在线多步启发式动态规划方法、介质及设备
申请号:CN202510448675
申请日期:2025-04-10
公开号:CN120406117A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种在线多步启发式动态规划方法、介质及设备,属于非线性系统控制领域,包括:针对非线性仿射系统,开发了一种在线多步启发式动态规划方法。通过结合行动者批判网络和经验回放技术,提高了学习速度,并能够在不依赖可接受控制条件的前提下实现更高效的策略评估。为了增强学习过程中数据的多样性,提出了一种融入ER技术的执行评判神经网络结构,使得代理能够在更少的样本上进行有效探索,从而减少了对训练数据的依赖。最后,通过仿真结果验证了所提算法的优越性,实验表明,在相同条件下,ER‑MSHDP算法相比传统HDP算法具有更快的学习进程,且随着步长增大,学习时间呈指数级下降。
技术关键词
启发式动态规划 估计误差 神经网络结构 在线 非线性系统控制 近似误差 函数获取方法 定义 动态规划方法 控制策略 重放技术 回放技术 处理器 梯度下降法 稳定系统 迭代方法 更新系统
系统为您推荐了相关专利信息
1
一种集成在模切机上的刀模刃口检测方法
光学检测模组 模切机 磨损特征 刃口 刀模
2
融合自监督学习和知识图谱的恶意指令检测方法及系统
动态知识图谱 指令 更新知识图谱 样本 损失函数优化
3
一种密封件密封性能在线检测方法
在线检测方法 相场模型 密封件 条形码 压力传感器阵列
4
一种多节伸缩精密升降杆及位置控制方法
位置控制方法 力矩 内管 联动机构 联动齿轮
5
一种非物质文化遗产数字化保护系统和方法
非物质文化遗产 数字化保护系统 子模块 手工艺品 民间艺术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号