摘要
本申请涉及集装箱调度技术领域,具体涉及一种基于强化学习的集装箱箱位推荐方法、系统、设备及介质,包括:获取堆场状态数据和待入场集装箱属性数据并编码为联合状态向量;将联合状态向量输入训练好的箱位推荐模型,计算所有可用箱位的动作价值,选择动作价值最高的箱位为推荐箱位,输出推荐箱位的位置信息;执行实际箱位选择操作,记录实际选择箱位的位置信息;根据实际选择箱位生成反馈信号;将联合状态向量、实际选择箱位、反馈信号及箱位选择后的堆场状态数据存入经验回放池,通过采样训练数据更新箱位推荐模型的参数。本申请可提升堆场空间利用率与作业效率,降低箱位冲突和翻箱移动成本,实现多目标协同优化,环境适应性强。
技术关键词
推荐方法
堆场
生成反馈信号
数据编码
数据更新
贪心策略
矩阵
强化学习算法
深度Q网络
集装箱船
数据采集模块
处理器
编码规则
推荐系统
模型更新
参数
介质
系统为您推荐了相关专利信息
数字孪生模型
输变电设备
更新方法
输电设备
模型预测值
金融产品推荐方法
大语言模型
上下文特征
编码器
预训练模型
神经网络模型
产品推荐方法
计算机程序产品
航空
产品推荐装置