摘要
本发明公开一种面向对抗环境多无人车巡检调度的安全决策方法,包括:步骤S1、通过场景评估层获取环境感知信息;步骤S2、将环境感知信息输入到决策层中进行分层决策执行机制下基于强化学习的巡检调度规划;步骤S3、决策层实时监控决策执行质量并进行自动恢复重试。采用本发明的技术方案,使得多无人车系统在大规模任务动态场景下能够更好地适应环境变化,克服传统多智能体强化学习算法的鲁棒性方面的不足,实现预设巡检性能指标的高效完成。
技术关键词
环境感知信息
决策方法
多智能体强化学习
强化学习框架
无人车系统
拍卖算法
动态场景
复杂度
机制
规划
分层
鲁棒性
系统为您推荐了相关专利信息
动态决策方法
水肥
生长预测模型
物联网技术
信息系统
碳基材料
废弃物处理工艺
数据
农业废弃物资源
田间环境
联合路径规划方法
机制构建方法
网络建模方法
多智能体强化学习
镜像