摘要
本发明提供了一种基于深度迁移强化学习的知识推理方法,本发明的具体实现过程主要包括两个关键阶段:(1)第一阶段侧重于通过有效性导向的预训练加强智能体的单步决策能力,有助于智能体学习挑选出有效的步骤,以增进智能体在探索路径时的效率与准确度;(2)第二阶段侧重于在特定任务上进行深入的多步推理训练,旨在提升智能体在特定推理任务中进行多步路径探索的能力,使智能体掌握在知识图谱中执行复杂推理的技巧,以便解决更加复杂的问题。本发明可有效解决在推理前期智能体由于选择无效动作而导致路径挖掘成功率大幅下降的问题,事实预测实验和链接预测实验等多维数据结果表明本发明可显著提高路径搜索的成功率,在主要推理任务中的表现均优于同类方法。
技术关键词
强化学习环境
实体
训练算法
知识推理方法
神经网络参数
策略
三元组
神经网络分类
训练智能体
构建知识图谱
训练集
关系
新药物
深度强化学习模型
疾病
模型算法
节点
知识图谱推理