用于人群自适应行为仿真的分层强化学习方法

正文

推荐专利

申请号：CN202511018669

申请日期：2025-07-23

公开号：CN120909106A

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及一种用于人群自适应行为仿真的分层强化学习方法，通过基于智能体在人群中的当前位置、目标点和环境结构构建其在静态封闭环境下的静态规划最优路径，并生成该智能体自当前位置点朝目标点移动的目标趋向速度，建立激光雷达观测数据到碰撞避免速度的非线性映射并基于智能体周身环境提供动态避障指引，根据智能体周围人员分布信息分别动态调整目标趋向速度权重和碰撞避免速度权重，并根据智能体当前的目标趋向速度、调整后目标趋向速度权重值、目标趋向速度权重调整值及调整后碰撞避免速度权重值做速度加权耦合，得到智能体自适应行走速度。如此，完成了在智能体不引起局部碰撞情况下实现全局路径优化，提高了强化学习效率。

技术关键词

分层强化学习规划最优路径速度路径搜索算法动态避障注意力机制强化学习模型门控循环单元风险激光雷达超参数生成方式矩阵非线性编码射线地点

系统为您推荐了相关专利信息

基于多重曝光技术的动态目标位姿测量方法

特征点位姿测量方法曝光技术坐标物体

一种地铁列车轴装制动盘热疲劳裂纹热应力仿真评估方法

仿真评估方法地铁列车疲劳裂纹瞬态温度场制动盘表面

分布式驱动轮式车辆稳定性控制方法、设备、介质及产品

稳定性控制方法分布式驱动轮式车辆车辆质心侧偏角车辆横摆角速度

基于视觉辅助的井下带式输送机调速控制系统及控制方法

调速控制系统调速控制装置皮带运行速度综合保护装置防爆变频器

基于粒子群优化和模拟退火的网络路由优化方法及装置

粒子群优化算法模拟退火算法通信链路位置更新网络设备

用于人群自适应行为仿真的分层强化学习方法

站点导航

APP 下载