摘要
本发明公开了一种基于强化学习的分层剪枝时序知识图谱推理方法,其目的是在不完整的时序知识图谱上推理更加准确,缓解动作空间爆炸问题和强化学习中的奖励稀疏问题。目前对基于强化学习的推理问题面临严重的动作空间爆炸问题和奖励稀疏问题,导致推理问题受到阻碍,并且这个问题广泛存在。本发明将基于强化学习的知识图谱推理任务分解为两层,高层实体选择层从关系簇中结合历史信息和时间信息推理出最佳实体,低层关系剪枝层则是进行排除时间剪枝不相关的关系,两层迭代推理,直到推理出目标结果。此外高层中提出了有纠错功能的动作回退机制和实时热奖励函数。该方法可以出色的解决推理过程中动作爆炸和奖励稀疏问题。本发明可以准确的得到在复杂时序知识图谱推理的结果。
技术关键词
知识图谱推理方法
强化学习框架
关系
长短期记忆网络
时序
分层
强化学习代理
错误实体
决策
纠错功能
策略
度函数
机制
系统为您推荐了相关专利信息
热管理控制方法
车辆热管理系统
长短期记忆网络
历史监测数据
训练集数据
压裂液
支持向量机回归
管理系统
模糊神经网络模型
粒子群优化算法
密封结构优化方法
立方体
引入粒子群算法
寿命
粒子群优化算法