摘要
本发明涉及智能体路径规划技术领域,尤其是一种基于融合DQN算法的多智能体无碰撞路径规划方法。多智能体无碰撞路径规划方法包括:首先构建二维栅格地图作为环境,并利用CNN进行特征提取;接着通过专家模型进行行为克隆学习获得BC模型;核心创新在于将BC模型与CNNDQN模型融合,构建自适应策略学习框架,采用不确定性估计、对抗性知识蒸馏和性能感知采样技术,实现专家经验与强化学习探索的智能动态结合;最终,融合模型输出的初步路径由CBS算法进一步处理,完成多智能体的无碰撞路径规划。该方法通过混合学习策略优化了路径规划的准确性和效率。
技术关键词
路径规划方法
DQN算法
栅格地图
方格
对抗性
终点
蒙特卡洛
策略
动态
生成无碰撞
路径规划技术
样本
框架
采样技术
网络
障碍物
决策