摘要
本发明公开一种基于聚类的改进SAC无人自行车平衡控制方法。该方法的具体包括如下步骤,首先对无人自行车建立改进的LPV力学模型,以无人自行车车体侧向倾角(倾角速度)、车把转角(转角速度)为输入,以车把控制力矩为输出,搭建强化学习的环境空间;其次通过手肘法和轮廓系数法得到最佳聚类类别中心数,利用双进程的方法执行K‑Means聚类算法,选取离聚类中心最近的若干经验元组训练网络;随后根据车体侧向倾角(倾角速度)、车把转角(转角速度)构造代价函数,最后结合梯度搜索方法优化系统的控制策略。该方法从交互的经验数据中学习,降低了模型对控制策略的影响,提高了无人自行车系统的鲁棒性及泛化能力。在数据处理上,该方法从聚类划分的数据簇中选取少量具有相同特征的数据用于网络训练,减少了网络训练所需的数据,有效提升SAC的数据利用效率,加快算法的收敛进程,具有重要的工程意义。
技术关键词
无人自行车
车体
搜索方法优化
网络
轮廓系数
控制策略
车把
随机梯度下降
聚类
数据
进程
控制力矩
算法
速度
鲁棒性
参数
力学
系统为您推荐了相关专利信息
深度强化学习
深度神经网络
图像
边界框回归方法
样本
水力计算方法
BP神经网络模型
水网
训练样本集
生成训练样本
B样条小波
鲁棒控制方法
样条小波神经网络
B样条神经网络
估计误差
自动投喂机
投喂系统
图像处理模块
图像采集模块
水面
压力机
工作状态监测
油压
管理方法
马尔科夫随机场模型