摘要
本发明提供了一种基于支持向量回归的近似动态规划控制方法,涉及近似动态规划技术领域,本发明提出了一种针对连续非线性系统的最优控制问题的方法,该方法融合了连续时间IRL贝尔曼方程和支持向量回归SVR技术,IRL的使用允许算法在部分系统动力学未知的情况下,通过积分项来估计价值函数,为在线学习提供了强有力的工具,且本发明首次将SVR应用于ADP中,将复杂的函数逼近问题转化为凸优化问题,确保了最优解的存在性和算法的稳定性。本发明通过采用HESVR,算法能够更精确地逼近成本函数和控制策略,同时利用最小二乘法对HESVR的权重进行调整,提高了算法的效率和准确性。
技术关键词
近似动态规划
支持向量回归
执行控制策略
无功补偿装置
迭代算法
频率
电压
控制权
非线性系统
矩阵
采样点
轨迹
方程
在线
终端
电机
系统为您推荐了相关专利信息
参数自动提取方法
仿真数据
失配模型
因子
迭代算法
建筑能源管理系统
数字孪生系统
优化控制策略
云端深度学习
设备控制接口
三维重建方法
图像采集设备
对象
三维重建系统
光照
库存控制方法
节点
信号失真
库存周转率
需求预测模型
多智能体系统
安全控制方法
体控制系统
数学模型
动态事件触发机制