摘要
本申请涉及多目标优化技术领域,特别涉及一种基于图向量更新和邻域搜索的深度强化学习方法及装置,方法包括:获取训练数据与测试问题,利用训练数据训练深度强化学习模型;利用训练完成的深度强化学习模型对测试问题进行编码,生成与权重向量无关的图向量,根据权重向量动态生成解码器参数,根据解码器参数构造针对不同优化偏好的求解策略,根据求解策略更新图向量;将测试问题划分为多个具有不同权重向量的子问题,在相邻权重向量对应子问题间迁移图向量,利用训练完成的深度强化学习模型从多个不同起点生成子问题的初始解集,对初始解集进行邻域搜索得到求解结果。由此,解决了相关技术问题规模可扩展性不足、对数据分布敏感性存在缺陷等问题。
技术关键词
深度强化学习方法
深度强化学习模型
邻域
解码器
策略更新
局部搜索算法
参数
计算机程序产品
超网络
动态
数据分布
处理器
指令
编码
可读存储介质
存储器
系统为您推荐了相关专利信息
空间跟踪定位方法
特征点
视差计算方法
运动跟踪
图像
性能优化方法
合金材料
贪婪策略
群体智能优化技术
算法
设施布局方法
粒子群优化算法
禁忌搜索算法
物料搬运
邻域