基于图向量更新和邻域搜索的深度强化学习方法及装置

正文

推荐专利

申请号：CN202510711595

申请日期：2025-05-29

公开号：CN120851116A

公开日期：2025-10-28

类型：发明专利

摘要

本申请涉及多目标优化技术领域，特别涉及一种基于图向量更新和邻域搜索的深度强化学习方法及装置，方法包括：获取训练数据与测试问题，利用训练数据训练深度强化学习模型；利用训练完成的深度强化学习模型对测试问题进行编码，生成与权重向量无关的图向量，根据权重向量动态生成解码器参数，根据解码器参数构造针对不同优化偏好的求解策略，根据求解策略更新图向量；将测试问题划分为多个具有不同权重向量的子问题，在相邻权重向量对应子问题间迁移图向量，利用训练完成的深度强化学习模型从多个不同起点生成子问题的初始解集，对初始解集进行邻域搜索得到求解结果。由此，解决了相关技术问题规模可扩展性不足、对数据分布敏感性存在缺陷等问题。

技术关键词

深度强化学习方法深度强化学习模型邻域解码器策略更新局部搜索算法参数计算机程序产品超网络动态数据分布处理器指令编码可读存储介质存储器

系统为您推荐了相关专利信息

任务执行方法、装置、电子设备和存储介质

输出特征序列卷积特征权重特征数据

语音识别模型的训练方法、装置、计算机设备及存储介质

多任务音频编码编码向量序列数据

基于改进SIFT特征点的双目视觉空间跟踪定位方法及系统

空间跟踪定位方法特征点视差计算方法运动跟踪图像

一种基于改进蜣螂优化算法的合金材料性能优化方法

性能优化方法合金材料贪婪策略群体智能优化技术算法

基于改进粒子群优化算法的带干涉不等面积设施布局方法

设施布局方法粒子群优化算法禁忌搜索算法物料搬运邻域

基于图向量更新和邻域搜索的深度强化学习方法及装置

站点导航

APP 下载