摘要
本发明涉及一种基于大语言模型知识增强的跨语言实体对齐方法,属于知识图谱对齐领域。所述方法,首先,运用大语言模型来增强实体和关系嵌入,提升训练过程中正负样本的区分度;然后,引入适应性融合加权来减弱各类嵌入的噪声,并且,引入双向柔性投票在无标签数据上生成更可靠的伪标签。CLEA‑LLM使用师生结构,教师编码器和学生编码器根据两个知识图谱和知识特征生成三类嵌入,教师编码器得到的特征经过适应性融合加权产生联合特征,又由双向柔性投票和多样性修正得到伪映射概率矩阵来监督学习编码器的学习,从而提升实体对齐的精度。
技术关键词
实体对齐方法
大语言模型
编码器
注意力
图谱
关系
计算机程序指令
生成知识
实体对齐模型
教师
柔性
三元组
标签
掩码矩阵
融合策略
噪声
学生
数据