摘要
本发明涉及知识工程领域,且公开了一种基于对抗强化学习的知识推理方法,包括生成器和鉴别器,在KGE框架中使用AttTuck Comp GCN嵌入模型得到实体和关系的向量表示,将潜在目标实体向量纳入RL框架,并采用评分函数作为计算候选实体的软奖励;生成器维护一个覆盖向量,然后根据状态信息计算每一步候选动作的概率,鉴别器捕获上下文路径表示并评估答案的准确性和推理路径的合理性;将鉴别器的两个反馈纳入奖励函数,生成器学习最大化预期奖励并执行行动,本发明具备能有效解决长距离依赖关系和高维复杂关系表示能力不足等问题,避免漫无目的地搜索导致收敛缓慢,缓解了强化学习框架中存在虚假路径问题的优点。
技术关键词
知识推理方法
实体
关系
答案
语义特征
令牌
网络
引入注意力机制
消息传递机制
强化学习框架
决策
策略
图谱
编码
三元组
参数
邻居
定义
系统为您推荐了相关专利信息
墙面检测方法
测距传感器
打磨机器人
压力传感器阵列
耦合结构