摘要
本发明公开了一种基于强化学习的动态环境下双层控制方法及系统,针对人机共存环境中多任务作业的路径规划问题,设计了双层强化学习架构,包括步骤:S1,根据机器人要执行的多任务作业,利用安全合作线性时序逻辑进行多任务原子命题化,构建所对应的有限状态自动机;S2,根据环境中人工驾驶车辆的观测状态,通过构建动态因素离散运动模型,完成环境不确定性测度;S3,根据环境不确定性测度,进行风险测度;S4,基于双层强化学习算法进行路径规划;S5,机器人作业过程中如果遇到作业中断,返回步骤S4,重新进行风险计算以及路径规划。本发明能实现局部与全局最优路径的有效结合,最终生成全局最优多任务作业路径。
技术关键词
双层控制方法
多任务作业
状态自动机
强化学习算法
风险
线性时序逻辑
动态
工作台
机器人作业
规划
标签函数
双层控制系统
机器人运动轨迹
车辆
定义
表达式
走廊
系统为您推荐了相关专利信息
康复训练策略
健康状态评估方法
健康知识图谱
数据特征提取
语义标签
智能车辆环境感知
风险预测模型
多模态
预警方法
生成模板
人参病害
多源时序数据
防治方法
风险评估模型
指标