基于边权建模的图分层强化学习方法、终端及存储介质

AITNT
正文
推荐专利
基于边权建模的图分层强化学习方法、终端及存储介质
申请号:CN202511366505
申请日期:2025-09-24
公开号:CN120874901A
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及分层强化学习技术领域,公开了基于边权建模的图分层强化学习方法、终端及存储介质。该方法从下层缓冲池的轨迹数据中随机采样得到第一候选节点集,从上层缓冲池的轨迹数据中随机采样得到第二候选节点集,在候选节点集中选取若干目标节点形成图结构节点集合;针对图结构节点集合中的任意两个节点,分别计算状态转移边权、能量距离边权和神经网络预测边权,将三种边权进行加权融合以计算总边权值;当两个节点间的总边权值不小于预设阈值时,保留对应的边并在该边中加入总边权值,形成具备语义边权的图结构,将图结构应用于分层强化学习的策略训练与路径规划。本发明提升了图结构的代表性和全局性,图结构具备更强的表达能力和可解释性。
技术关键词
分层强化学习 节点 轨迹 网络结构 缓冲 策略 语义 三元组 计算机终端 样本 处理器 数据 可读存储介质 规划 格式 存储器 非线性
系统为您推荐了相关专利信息
1
配网线路开关分段方法、装置、存储介质及电子设备
线路 决策 分段 开关 电子设备
2
数据处理方法、K8s服务系统及计算机可读存储介质
K8s集群 虚拟机实例 控制面节点 数据处理方法 对象
3
电池箱体自动焊接装置及其工作方法
自动焊接装置 框架主体 电池箱体 预热系统 预热箱体
4
自动理发方法、装置、设备、存储介质和计算机程序
毛发 理发装置 理发方法 剪切机构 对象
5
网络安全动态预警方法、装置和电子设备
查询算法 果蝇优化算法 高浓度 图谱 网络安全预警
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号