摘要
一种基于多智能体深度确定性策略梯度算法的改进路径规划算法LADP‑MADDPG,属于人工智能技术领域,该算法通过引入长短期记忆网络为智能体捕捉时序信息,增强智能体决策的灵活性与协作能力;设计基于人工势场法思想的奖励函数,解决奖励稀疏问题的同时引导智能体更好地完成路径规划;结合优先经验回放机制提出了一种多维动态优先级计算法,通过提高样本多样性及样本利用率避免陷入局部最优并提升收敛速度。实验结果表明,在不同数量智能体环境以及不同障碍物复杂度环境下,与原始MADDPG算法相比,LADP‑MADDPG算法在收敛速度、成功率、平均路径长度方面均表现出显著优势,验证了其在不同环境下的适应性与鲁棒性。
技术关键词
深度确定性策略梯度
路径规划算法
样本
长短期记忆网络
人工势场法
优先级计算方法
动态环境变化
多智能体系统
障碍物
人工智能技术
时序
代表
速度
决策
鲁棒性
因子
机制
系统为您推荐了相关专利信息
图像识别模型
序列
文本识别模型
视频
大语言模型
行人重识别网络
行人重识别模型
样本
生成对抗网络
矩阵
校园场景
运动轨迹分析
校园监控
长短期记忆模型
融合特征