摘要
本发明公开了一种基于强化学习的爬清洗车差速转向驱动系统控制方法,其属于船体清洗小车控制方法技术领域。包括以下步骤:模型建立,将爬壁清洗车差速转向驱动控制过程建模为马尔科夫决策过程;完成状态空间、动作空间定义;构建差速转向驱动系统状态转移模型;获取当前状态数据,通过模型生成转向轮速和转向时间分配策略;执行转向动作策略,更新执行动作后的状态数据;根据实际执行效果返回奖励以评判动作策略优劣;通过经验回放池进行模型优化;重置场景继续训练直至模型收敛,最终获取训练完成的差速转向驱动系统模型。本发明降低了路径规划和控制算法的复杂性,满足最大化清洗覆盖面积需求,简化了路径规划和控制算法的难度。
技术关键词
驱动系统控制方法
清洗车
转向驱动系统
动作策略
状态转移模型
坐标系
样本
数据
深度Q网络
清洗小车
贪心算法
指标
速度
决策
计算方法
定义
参数