摘要
本发明涉及分层强化学习技术领域,公开了基于边权建模的图分层强化学习方法、终端及存储介质。该方法从下层缓冲池的轨迹数据中随机采样得到第一候选节点集,从上层缓冲池的轨迹数据中随机采样得到第二候选节点集,在候选节点集中选取若干目标节点形成图结构节点集合;针对图结构节点集合中的任意两个节点,分别计算状态转移边权、能量距离边权和神经网络预测边权,将三种边权进行加权融合以计算总边权值;当两个节点间的总边权值不小于预设阈值时,保留对应的边并在该边中加入总边权值,形成具备语义边权的图结构,将图结构应用于分层强化学习的策略训练与路径规划。本发明提升了图结构的代表性和全局性,图结构具备更强的表达能力和可解释性。
技术关键词
分层强化学习
节点
轨迹
网络结构
缓冲
策略
语义
三元组
计算机终端
样本
处理器
数据
可读存储介质
规划
格式
存储器
非线性
系统为您推荐了相关专利信息
K8s集群
虚拟机实例
控制面节点
数据处理方法
对象
自动焊接装置
框架主体
电池箱体
预热系统
预热箱体
查询算法
果蝇优化算法
高浓度
图谱
网络安全预警