摘要
本发明公开了一种基于偏好的多目标强化学习智能仓储路径优化方法,首先建立分区模式的行列交叉仓储布局方案,其次建立节点间距离计算模型;然后建立以最小化总运输距离、最小化最大运输距离为目标的多目标容量约束智能仓储路径优化数学模型;然后基于偏好的多目标强化学习算法来解决所建立模型,以有向图作为输入,通过注意力编码器进行节点嵌入,通过基于偏好的注意力解码器进行节点的上下文嵌入,并通过基于进化遗传搜索算法的突变操作进行变异;最后使用强化算法来学习一个最优的偏好条件策略,产生解决方案。本发明的方法不仅能有效降低运输冲突概率,减少车辆运输距离,还能有效平衡目标间的冲突,产生密集的可权衡的近似帕累托解决方案。
技术关键词
路径优化方法
智能仓储
注意力编码器
节点间距离
多层感知机
搜索算法
强化学习算法
解码器
注意力模型
坐标
运输车辆
切比雪夫
数学模型
参数
双曲正切函数
布局
策略