摘要
本发明公开了一种基于异构神经回路策略的移动机器人的人群导航方法,包括构建时空图,将雷达扫描采集的原始局部地图数据转换成栅格地图数据;构建异构神经回路策略网络模型和奖励函数;将时空图和栅格地图数据输入到异构神经回路策略网络模型中,异构神经回路策略网络模型输出机器人在当前环境下最优价值的动作;搭建强化学习交互的仿真环境以训练异构神经回路策略网络模型,采用并行PPO算法加速异构神经回路策略网络模型的训练速度直到训练完成,将训练好的异构神经回路策略网络模型应用于实际场景中。本发明具有更高的导航成功率、更低的碰撞风险和更强的环境感知和建模能力,在高度动态和拥挤的复杂场景中展现出了优异性能。
技术关键词
策略网络模型
多层感知机
回路
移动机器人
异构
导航方法
仿真环境
编码向量
注意力机制
静态障碍物
栅格地图特征
交互特征
决策
数据
网络架构
系统为您推荐了相关专利信息
多源异构数据
采集器
数据采集模块
传感器
分配系统资源
李雅普诺夫函数
转换误差
车辆队列协同控制
队列模型
加速度
单体电池
开关电源
阻抗变化趋势
温控电阻
谐波潮流
语义本体
信息融合方法
语义层面
物联
多层次特征提取
诊断管理方法
车载终端
资源调度信息
数据关联信息
多源异构数据