基于深度强化学习的货到人系统多AGV路径规划方法

正文

推荐专利

申请号：CN202510139194

申请日期：2025-02-08

公开号：CN120010487B

公开日期：2025-10-10

类型：发明专利

摘要

本发明涉及计算机领域的一种基于深度强化学习的货到人系统多AGV路径规划方法，融合改进A*全局引导与局部强化学习的双层规划架构，全局层采用非均匀惩罚启发式策略，通过Dijkstra算法计算的固定惩罚项和基于历史路径的实时动态惩罚项协同优化路径分散性；局部层设计异步近端策略优化(APPO)算法，结合LSTM网络处理连续5个时间步的多通道观测状态(静态障碍物、AGV位置、全局路径编码)，输出5自由度动作策略。针对仓储可移动货架(Pod)区域设置固定惩罚豁免机制，避免无效避让，提高任务成功率和吞吐量，降低计算负载，为解决货到人系统多AGV路径规划问题提供了一种高效且可扩展的解决方案。

技术关键词

路径规划方法深度强化学习局部路径规划 Dijkstra算法静态障碍物栅格 AGV路径规划动作策略动态环境变化集构造方法可移动货架强化学习框架启发式策略活动货架编码器网络路径地图启发式算法

系统为您推荐了相关专利信息

一种基于AI技术的风扇性能测试方法

多模态特征性能测试方法传感装置性能测试报告控制测试设备

一种基于深度强化学习的抽水蓄能电站碳优化方法

抽水蓄能电站深度强化学习算法多智能体系统策略引入经验回放机制

无人机避障方法、装置、无人机及存储介质

无人机避障方法点云信息局部路径规划框架数据

一种基于置信度上界搜索的雷达自适应干扰决策方法

雷达干扰决策方法参数效能神经网络结构样式

目标引导的苹果多目标连续采摘路径规划方法

路径规划方法节点三维工作空间工控计算机末端执行器

基于深度强化学习的货到人系统多AGV路径规划方法

站点导航

APP 下载