基于强化学习和径向基函数神经网络的自适应控制方法

AITNT
正文
推荐专利
基于强化学习和径向基函数神经网络的自适应控制方法
申请号:CN202411612394
申请日期:2024-11-12
公开号:CN119644723A
公开日期:2025-03-18
类型:发明专利
摘要
本发明涉及信息技术技术领域,具体涉及基于强化学习和径向基函数神经网络的自适应控制方法,包括:建立具有未知时变不确定性的非线性系统的状态方程,定义系统状态变量和控制目标;在强化学习框架下,初始化控制策略和价值函数,设定初始网络参数,初步估计不确定性的上确界;利用径向基函数神经网络对系统的不确定性进行实时估计,通过调整径向基函数神经网络的参数,逼近不确定性的上确界;基于估计的不确定性,对控制策略进行迭代更新,在每次迭代中,利用强化学习算法优化控制策略;实时调整控制策略,基于最新的不确定性估计值,对控制策略参数进行优化,并通过收敛性分析得到最终稳定的控制策略。通过本发明,有效解决了需要预先知道不确定性上界的问题,提高了系统鲁棒性和控制精度,动态自适应能力强,简化了控制策略设计,增强了系统稳定性和响应效率。
技术关键词
径向基函数神经网络 强化学习算法 优化控制策略 强化学习框架 非线性系统 高斯径向基函数 定义系统 信息技术技术 鲁棒性评估 神经网络参数 系统仿真 迭代算法 收集系统 表达式 指标 动态
系统为您推荐了相关专利信息
1
一种多无人机协同海上风机巡检路径规划方法及装置
巡检路径规划方法 海上风机 多无人机协同 无人机巡检装置 DQN算法
2
一种火力发电厂的智能调度与优化方法
混合整数线性规划模型 时间序列模型 数据挖掘算法 深度强化学习模型 负荷预测模型
3
一种面向无信号灯路口场景的多智能体无人驾驶决策方法及系统
无信号灯 路口场景 决策方法 动态噪声 无信号交叉口
4
一种基于语义概率重构的细粒度流混淆的对抗训练方法
强化学习代理 功能块 语义 恶意样本 对抗性
5
一种基于物联网定位技术的考勤管理方法及系统
物联网定位技术 考勤管理方法 打卡设备 考勤机 LSTM模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号