一种结合深度强化学习和启发式算法的旅行商问题求解方法

正文

推荐专利

申请号：CN202411127945

申请日期：2024-08-16

公开号：CN119106778A

公开日期：2024-12-10

类型：发明专利

摘要

本发明提出一种结合深度强化学习和启发式算法的旅行商问题求解方法，包括：将学习改进启发式算法求解旅行商问题的任务定义为一个马尔可夫决策过程；设计一个基于Transformer的新模型M，使策略网络参数化，并引入一个动作丢弃机制来防止动作选择过拟合；提出一个结合模拟退火机制的深度强化学习方法(RL‑SA)来学习节点对操作算子的选择策略以实现改进2‑opt算法的性能；RL‑SA利用鲸鱼优化算法生成初始解来提高采样效率，并使用高斯扰动策略来解决强化学习中的稀疏奖励问题。本发明在TSPLIB数据集和真实的集装箱班轮航运数据集上均显著优于现有的基于学习的方法，并进一步缩小了与高度优化求解器之间的差距。

技术关键词

启发式算法策略网络模型鲸鱼优化算法模拟退火算法 Softmax函数位置更新解码器注意力深度强化学习方法矩阵编码器节点特征强化学习算法螺旋式参数序列机制

系统为您推荐了相关专利信息

基于盒嵌入统一医学概念结构和语义的医疗诊断预测方法及系统

诊断预测方法盒结构概念医学预训练语言模型

一种基于少样本学习的基因组变异检测方法及系统

基因组变异检测方法样本记忆实体解码模块

一种基于MF-SPCM的次季节降水预报订正方法

历史气象数据订正方法数字高程模型注意力 Softmax函数

钓鱼文档解混淆和特征提取方法及其在攻击检测中的应用

解混淆方法抽象语法树文档特征提取计算机系统执行预训练语言模型

异构卫星集群自主测控资源分配方法、系统及设备

混合整数规划模型资源分配方法深度强化学习异构集群

一种结合深度强化学习和启发式算法的旅行商问题求解方法

站点导航

APP 下载