摘要
本发明涉及一种基于DDQN算法的多AGV路径规划方法。方法包括:根据仓库布局获取AGV运输任务;建立AGV的状态空间、动作空间以及奖励函数;构建AGV路径规划模型;从环境中获取当前状态并将当前状态输入主网络;主网络生成当前Q值并输入至DDQN误差函数;主网络计算目标Q值,并根据当前Q值和目标Q值计算TD误差;将TD误差和经验样本存储至经验池中;目标网络从经验池中获取下一状态并对应生成下一状态最优Q值,并将下一状态最优Q值输入DDQN误差函数;DDQN误差函数根据当前Q值和下一状态最优Q值计算损失函数值,并反向传播计算误差函数梯度,更新网络参数;循环迭代直到达到最大训练回合数,获取训练后的AGV路径规划模型并进行多AGV路径规划。
技术关键词
路径规划方法
误差函数
AGV路径规划
算法
更新网络参数
计算误差
网络同步
策略
样本
仓库
布局
拷贝
批量
因子
系统为您推荐了相关专利信息
硬件加速器模块
可编程逻辑器件
神经网络硬件加速技术
数据处理模块
多通道特征
自助终端显示屏
环境光线强度
环境光传感器
图像识别模块
调节系统
ECU控制单元
无线通信模块
诊断方法
机器学习算法
物理