摘要
本申请涉及一种基于深度强化学习的非稳态人群疏散路径规划方法及装置。所述方法包括:以离散网格法将非稳态疏散环境简化为二维区域。对危险源动态扩散建模,据此实时更新火源位置与范围,模拟火灾动态发展。将人员被视为智能体,按势能场引导的决策规则移动。以最大化疏散人数且最小化疏散时间为目标函数,结合商场实际及智能体移动规律确定约束条件,构建非稳态人群疏散路径规划模型。采用 APF‑MADDPG 算法,将路径规划转化为马尔科夫决策过程,设计状态特征并结合势能场构建深度强化学习框架,训练模型后用于实现非稳态人群疏散路径规划。采用本方法能够提高人群疏散路径规划实用性和实时性。
技术关键词
疏散路径规划
深度强化学习
稳态
动态
网络
障碍物
网格
生成动作
决策
火灾
框架
模块
商场
机制
位置更新
参数
策略
邻域
算法
系统为您推荐了相关专利信息
群智能优化算法
人工神经网络
人工蜂群算法
免疫算法
导航电文
CT投影数据
文本识别模型
校正方法
偏移特征
CT系统