摘要
本发明公开了一种基于混合探索策略的AGV路径规划方法,其设计混合探索策略,随机选取一个AGV状态作为当前输入,通过深度强化学习算法和A*算法融合输出最优动作;在深度强化学习算法采用深度Q网络DQN算法,并利用SNN作为DQN的策略网络和目标网络,显著降低能耗;结合A*算法的全局路径先验与SNN‑DQN的动态适应能力,提高了算法在动态复杂场景下的适应能力,减少碰撞风险,采用混合探索策略加快了收敛速度,提升了训练效率;采用梯度替代函数反向传播计算误差函数梯度,绕过不可微点,实现端到端梯度反向传播,解决了脉冲神经网络训练的难题。
技术关键词
路径规划方法
深度强化学习算法
DQN算法
策略
神经网络参数
sigmoid函数
脉冲
深度Q网络
计算误差
神经网络训练
信息处理
数学模型
样本
动态
可读存储介质
因子
处理器