摘要
本发明公开了一种基于改进RND3QN网络的多智能体路径规划方法及系统,方法包括:数据获取及数据预处理,对原始图像、雷达和自身状态数据进行格式转换;构建卷积神经网络‑长短期记忆架构,提取多源测量特征向量作为RND3QN的输入;采用改进的RND3QN算法框架,设计一种基于多智能体位置约束的新奖励函数;通过增量学习策略对模型进行训练,实现多个智能体的协作路径规划;引入贪心策略和玻尔兹曼概率选择策略,避免收敛到局部极值;采用n步时序差分算法减少偏差。本申请提高了路径规划的准确度,降低了移动过程中碰撞的概率,缩短了循迹时间,增强了对动态障碍物躲避能力,有利于多智能智能体的合理调度。
技术关键词
原始图像数据
贪心策略
混沌振荡器
表达式
差分算法
特征点集合
动态障碍物
线特征
雷达
矩阵
非线性
构建卷积神经网络
移动智能体
彩色图像
路径规划系统
系统为您推荐了相关专利信息
年龄识别模型
年龄识别方法
文本
预训练模型
人脸图像数据