一种基于深度强化学习的大规模旅行商问题求解方法

正文

推荐专利

申请号：CN202411011372

申请日期：2024-07-26

公开号：CN119047671A

公开日期：2024-11-29

类型：发明专利

摘要

本发明公开了一种基于深度强化学习的大规模旅行商问题求解方法，包括：(1)将大规模旅行商问题建模为马尔科夫决策过程；(2)随机生成一系列大规模旅行商问题实例并进行数据增强，得到训练数据；(3)构建基于端到端深度强化学习的大规模旅行商问题求解模型架构，该模型包括编码器和解码器，编码器采用快速注意力机制作为注意力层，解码器使用一个特殊的上下文节点来表示当前的解码状态；(4)设计决策网络，训练模型；决策网络选择REINFORCE，利用深度强化学习方法中的对称性对REINFORCE算法进行改进；(5)利用训练好的模型进行旅行商问题求解，并对求解结果进行优化。本发明可以解决大规模旅行商问题求解中时间效率和内存占用的双重挑战。

技术关键词

深度强化学习方法注意力机制解码器编码器决策动态更新节点网络策略数据基线算法分块指针参数内存坐标

系统为您推荐了相关专利信息

车辆安全驾驶方法、装置、设备以及存储介质

车辆强化学习算法决策意图参数

一种生成方言语音合成大模型的方法

拼音信息编码器语音收集训练数据语义

一种风险评估方法、装置、设备及存储介质

风险评估方法风险评估模型数据多层感知机气象

一种基于多源数据融合的彩涂钢板耐候性能评估方法

腐蚀形貌彩涂钢板表面图像数据物联网传感设备支持向量机模型

基于多尺度扩散模型的统一底层视觉预训练方法

预训练方法多尺度视觉语义特征条件可控

一种基于深度强化学习的大规模旅行商问题求解方法

站点导航

APP 下载