摘要
本发明公开了一种对抗和注意力机制引导的强化学习知识图谱推理方法及系统,方法包括:构建知识图谱环境,使用知识图谱嵌入模型将知识图谱中的实体和关系进行状态编码;基于状态编码与查询的三元组关系进行计算,获得累计交互权重值,根据累计交互权重值对当前状态的工作空间进行修剪;智能体根据推理策略在每个状态下的空间动作中选择一个动作,同时使用LSTM对智能体的探索路径进行记录,将选择的动作返回给知识图谱环境,知识图谱环境更新状态,并根据当前状态判断是否到达预计目标节点;智能体通过与环境的交互学习最优的知识图谱推理策略,以最大化长期奖励。本发明提高了推理结果的可解释性,为推理模型的应用和理解提供了有力支持。
技术关键词
知识图谱推理方法
注意力机制
实体
构建知识图谱
模块
策略
Softmax函数
知识图谱数据
强化学习框架
关系
强化学习算法
编码
三元组
存储计算机程序
节点
电子设备
系统为您推荐了相关专利信息
智能控制模块
药型罩
裂纹结构
纳米铝热剂
微胶囊封装技术
指令做出响应
模式匹配算法
网络爬虫技术
终端模块
漏洞
印刷控制系统
背光模组
基板传送装置
压电传感器阵列
油墨印刷工艺
大语言模型
知识编辑方法
训练样本数据
模块
计算机可读取存储介质