摘要
本申请公开了一种基于安全强化学习的Unicycle多智能体动态覆盖控制方法,所述Unicycle多智能体动态覆盖控制方法包括:首先,对Unicycle智能体、各向异性传感器和多智能体系统动态覆盖控制任务进行建模;然后,根据Unicycle的输入限制和避障避碰等安全要求设计相应的约束力,以此设计安全防护机制,当智能体即将做出不安全的动作时对其控制指令进行矫正,保证智能体在动态覆盖过程中的安全性;最后,配合多智能体深度强化学习算法对动态覆盖控制安全决策模型进行训练,并基于状态压缩的观测编码方式,提升动态覆盖控制安全决策模型对可变环境的适应能力,执行动态覆盖控制安全决策模型完成Unicycle多智能体动态覆盖控制。
技术关键词
覆盖控制方法
策略网络模型
多智能体系统
决策
障碍物
多智能体动态
传感器
深度强化学习模型
矫正器
覆盖误差
网络结构
参数
样本