一种基于强化学习奖励塑造的分布式多智能体路径规划方法

正文

推荐专利

申请号：CN202510420334

申请日期：2025-04-03

公开号：CN120274781A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开了一种基于强化学习奖励塑造的分布式多智能体路径规划方法，属于协同路径规划领域。方法包括，对多智能体路径规划问题进行建模；通过设计奖励塑造机制，量化智能体行为对邻居的影响，并将其融入奖励函数，从而引导智能体在最大化自身累计奖励的同时，实现协作性避碰；采用分布式强化学习算法训练智能体，使其基于局部观测数据进行高效的路径规划。本方法通过奖励塑造解决多智能体间因局部观测带来的冲突问题，有效提高多智能体路径规划任务的成功率和效率，并保持推理阶段的低计算开销。本发明适用于大规模多智能体场景中的多智能体路径规划任务，广泛应用于交通运输、物流调度等领域。

技术关键词

分布式多智能体分布式强化学习路径规划方法邻居策略协同路径规划强化学习环境训练智能体更新网络参数指标深度Q网络梯度下降法栅格地图障碍物传播算法

系统为您推荐了相关专利信息

一种基于深度强化学习的无人机覆盖路径规划方法

覆盖路径规划方法强化学习网络深度强化学习矩阵双通道信息

一种基于历史数据导向的超声甲状腺结节智能检测方法

智能检测方法患者超声检测仪器甲状腺结节检测深度学习算法

基于大模型的数据预测方法、系统及存储介质

数据预测方法对象模拟模型样本音频特征

基于视觉大模型的重量估计方法

估计方法多模态视觉校准策略物体

基于分布式时变优化算法的多机器人固定时间协同围捕方法及系统

围捕方法多机器人系统分布式方式机器人系统设计拓扑图

一种基于强化学习奖励塑造的分布式多智能体路径规划方法

站点导航

APP 下载