摘要
本发明公开了一种基于强化学习和模仿学习的塔吊路径智能规划方法,该方法首先基于行为克隆算法BC模仿专家演示的吊运轨迹学习到可行的初始吊运策略;随后基于线性函数的训练策略将近端策略优化算法PPO和生成对抗模仿学习算法GAIL的损失函数进行线性组合,以充分结合强化学习和模仿学习的优点,最终构建塔吊智能路径规划模型,从而提高规划路径的可操作性,本发明提出一种结合强化学习算法与模仿学习算法的路径规划模型,通过学习和模仿操作人员的吊运策略,在训练中与环境交互并不断迭代优化,生成同时具备较高的运输效率、吊运安全和可操作性的塔吊吊运路径。
技术关键词
路径智能规划
塔吊吊钩
智能路径规划
施工现场堆放材料
塔吊驾驶室
头戴式显示器执行
克隆策略
学习算法
操纵杆
连续动作空间
虚拟仿真环境
障碍物
混合损失函数
摇杆
更新网络参数
系统为您推荐了相关专利信息
消防预警系统
火灾风险评估
火灾特征
无线自组网通信协议
数据分析模块
智能检测机器人
电力换流站
智能电源管理模块
模块化电池组
搜索算法
光伏板
无人驾驶智能设备
清扫路径规划方法
作业路径规划方法
自动智能设备
无人驾驶装载机
智能路径规划方法
全局路径规划
占据栅格地图
传感器获取环境