一种用于路径规划的基于深度强化学习的高效渐进策略增强框架

正文

推荐专利

申请号：CN202411643108

申请日期：2024-11-18

公开号：CN119599229A

公开日期：2025-03-11

类型：发明专利

摘要

本发明公开了一种基于深度强化学习(DRL)，同时用于路径规划场景的高效渐进策略增强(EPPE)框架，该框架辅助DRL算法，用于解决DRL在路径规划中面临的训练效率和组合优化的双重挑战。该框架结合了稀疏奖励和过程奖励的优点，稀疏奖励帮助智能体实现全局最优策略，而过程奖励提供实时反馈，便于智能体及时调整策略。不仅显著提高策略学习的效率，还有效解决了过程奖励引起的奖励耦合问题，从而实现策略的全局最优。本发明可应用于机器人路径规划的研究领域，在自动驾驶和物流配送等应用领域中发挥重要作用。

技术关键词

深度强化学习方法策略优化模型机器人路径规划动态窗口法框架阶段决策机制障碍物代表算法基线基础场景定义

系统为您推荐了相关专利信息

一种基于大模型的数据字段生成方法及装置

数据字深度学习框架生成方法生成装置假设解码器

远程调用加速设备的方法、设备、存储介质及程序产品

加速设备深度学习框架服务端客户端加载设备

一种爬壁机器人浮动磁瓦结构及采用该浮动磁瓦结构的爬壁机器人

磁瓦结构吸附单元机器人主体爬壁机器人底板

一种电磁驱动的自重构空间细胞机器人模块

电磁驱动机构电磁驱动方式齿轮盒空间细胞机器人密封机构

一种基于多约束的PnP-GAP重建方法及相关设备

数学模型变量周期可读存储介质矩阵

一种用于路径规划的基于深度强化学习的高效渐进策略增强框架

站点导航

APP 下载