摘要
本发明提供了一种基于卷积增强代理注意力机制的CTSP求解方法及系统,涉及数据处理技术领域,方法包括:获取城市数据和销售员数据;基于城市数据和销售员数据,构建用于描述CTSP问题实例的完全图;基于完全图,构建约束马尔可夫决策过程模型,将路径生成过程建模为逐步决策机制;构建基于卷积增强和代理注意力机制的神经策略网络,其中,神经策略网络用于求解约束马尔可夫决策过程模型;利用强化学习算法对基于卷积增强和代理注意力机制的神经策略网络进行训练;通过训练后的基于卷积增强和代理注意力机制的神经策略网络,生成初步最优路径方案;将最优路径方案输入至传统优化器进行精细优化,得到最终的最优路径方案。
技术关键词
注意力机制
颜色
决策
策略
坐标
强化学习算法
矩阵
节点特征
仓库
变量
语义特征
前馈神经网络
定义
优化器
求解系统
数据处理技术
系统为您推荐了相关专利信息
信息安全防护装置
无人车
流式大数据分析
非对称加密算法
销毁存储介质
数据采集模块
克里金插值算法
构建三维场景
构建知识图谱
DTW算法
协同过滤算法
决策树算法
个性化推荐算法
机器可读程序
智能数据分析技术
焊缝缺陷检测方法
网络结构
检测头
特征金字塔网络
卷积模块