摘要
本发明提供了一种知识图谱补全的方法,旨在提升知识图谱补全的精确性与有效性。该方法首先获取并扩展知识图谱的三元组数据,通过生成逆三元组补充数据集。结合多种负样本生成技术提升模型对错误链接的识别能力,利用双文本编码器对三元组中的实体与关系进行文本嵌入学习。提出了可变形自适应注意力模块,对文本特征进行潜在特征捕获。通过计算文本嵌入的余弦相似性得分并添加路径推理增益得分,得到三元组相似性得分。使用具有裕度的信息噪声对比估计损失函数优化文本嵌入,有效提高补全效果。最终,使用训练后的知识图谱补全模型,完成三元组最大相似性匹配。本发明方法能够捕捉复杂的语义关联,增强知识图谱补全的精度和鲁棒性。
技术关键词
文本编码器
三元组
知识图谱补全
实体
关系
双线性插值法
多头注意力机制
训练语言模型
查询特征
样本生成方法
损失函数优化
数据
生成技术
度函数
噪声