基于图向量更新和邻域搜索的深度强化学习方法及装置

AITNT
正文
推荐专利
基于图向量更新和邻域搜索的深度强化学习方法及装置
申请号:CN202510711595
申请日期:2025-05-29
公开号:CN120851116A
公开日期:2025-10-28
类型:发明专利
摘要
本申请涉及多目标优化技术领域,特别涉及一种基于图向量更新和邻域搜索的深度强化学习方法及装置,方法包括:获取训练数据与测试问题,利用训练数据训练深度强化学习模型;利用训练完成的深度强化学习模型对测试问题进行编码,生成与权重向量无关的图向量,根据权重向量动态生成解码器参数,根据解码器参数构造针对不同优化偏好的求解策略,根据求解策略更新图向量;将测试问题划分为多个具有不同权重向量的子问题,在相邻权重向量对应子问题间迁移图向量,利用训练完成的深度强化学习模型从多个不同起点生成子问题的初始解集,对初始解集进行邻域搜索得到求解结果。由此,解决了相关技术问题规模可扩展性不足、对数据分布敏感性存在缺陷等问题。
技术关键词
深度强化学习方法 深度强化学习模型 邻域 解码器 策略更新 局部搜索算法 参数 计算机程序产品 超网络 动态 数据分布 处理器 指令 编码 可读存储介质 存储器
系统为您推荐了相关专利信息
1
任务执行方法、装置、电子设备和存储介质
输出特征 序列 卷积特征 权重特征 数据
2
语音识别模型的训练方法、装置、计算机设备及存储介质
多任务 音频编码 编码向量 序列 数据
3
基于改进SIFT特征点的双目视觉空间跟踪定位方法及系统
空间跟踪定位方法 特征点 视差计算方法 运动跟踪 图像
4
一种基于改进蜣螂优化算法的合金材料性能优化方法
性能优化方法 合金材料 贪婪策略 群体智能优化技术 算法
5
基于改进粒子群优化算法的带干涉不等面积设施布局方法
设施布局方法 粒子群优化算法 禁忌搜索算法 物料搬运 邻域
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号