一种多出口场景下基于深度强化学习的多智能体疏散方法

正文

推荐专利

申请号：CN202410755882

申请日期：2024-06-12

公开号：CN118536540A

公开日期：2024-08-23

类型：发明专利

摘要

本发明涉及一种多出口场景下基于深度强化学习的多智能体疏散方法，主要解决现有技术中存在的多智能体疏散模型受限于特定规则和模型、泛化性差难以灵活应对多出口场景的问题。它包括五个步骤：1)初始化环境并设置训练参数。2)收集经验数据并更新经验数据缓冲区，通过混合动作控制智能体运动，设计复合奖励函数计算即时奖励。3)经验回放与模型更新，利用想象力机制优化价值网络。4)模型测试。5)中间结果可视化与模型存储。本发明方法能够应对不同的复杂环境，增强了算法的学习效率和泛化能力，能够使智能体探索到更多可行路径，有效解决复杂和动态变化的场景下的疏散任务。同时，降低了智能体在疏散过程中的碰撞风险，并提高了疏散效率。

技术关键词

深度强化学习策略场景模型更新控制智能体参数可视化方式优化器机制生成动作鲁棒性指标速度决策网络结构算法数据存储变量

一种多出口场景下基于深度强化学习的多智能体疏散方法

站点导航

APP 下载