一种基于强化学习奖励塑造的分布式多智能体路径规划方法

AITNT
正文
推荐专利
一种基于强化学习奖励塑造的分布式多智能体路径规划方法
申请号:CN202510420334
申请日期:2025-04-03
公开号:CN120274781A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了一种基于强化学习奖励塑造的分布式多智能体路径规划方法,属于协同路径规划领域。方法包括,对多智能体路径规划问题进行建模;通过设计奖励塑造机制,量化智能体行为对邻居的影响,并将其融入奖励函数,从而引导智能体在最大化自身累计奖励的同时,实现协作性避碰;采用分布式强化学习算法训练智能体,使其基于局部观测数据进行高效的路径规划。本方法通过奖励塑造解决多智能体间因局部观测带来的冲突问题,有效提高多智能体路径规划任务的成功率和效率,并保持推理阶段的低计算开销。本发明适用于大规模多智能体场景中的多智能体路径规划任务,广泛应用于交通运输、物流调度等领域。
技术关键词
分布式多智能体 分布式强化学习 路径规划方法 邻居 策略 协同路径规划 强化学习环境 训练智能体 更新网络参数 指标 深度Q网络 梯度下降法 栅格地图 障碍物 传播算法
系统为您推荐了相关专利信息
1
一种基于深度强化学习的无人机覆盖路径规划方法
覆盖路径规划方法 强化学习网络 深度强化学习 矩阵 双通道信息
2
一种基于历史数据导向的超声甲状腺结节智能检测方法
智能检测方法 患者 超声检测仪器 甲状腺结节检测 深度学习算法
3
基于大模型的数据预测方法、系统及存储介质
数据预测方法 对象 模拟模型 样本 音频特征
4
基于视觉大模型的重量估计方法
估计方法 多模态 视觉 校准策略 物体
5
基于分布式时变优化算法的多机器人固定时间协同围捕方法及系统
围捕方法 多机器人系统 分布式方式 机器人系统设计 拓扑图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号