基于大语言模型知识增强的跨语言实体对齐方法

正文

推荐专利

申请号：CN202510610426

申请日期：2025-05-12

公开号：CN120524236A

公开日期：2025-08-22

类型：发明专利

摘要

本发明涉及一种基于大语言模型知识增强的跨语言实体对齐方法，属于知识图谱对齐领域。所述方法，首先，运用大语言模型来增强实体和关系嵌入，提升训练过程中正负样本的区分度；然后，引入适应性融合加权来减弱各类嵌入的噪声，并且，引入双向柔性投票在无标签数据上生成更可靠的伪标签。CLEA‑LLM使用师生结构，教师编码器和学生编码器根据两个知识图谱和知识特征生成三类嵌入，教师编码器得到的特征经过适应性融合加权产生联合特征，又由双向柔性投票和多样性修正得到伪映射概率矩阵来监督学习编码器的学习，从而提升实体对齐的精度。

技术关键词

实体对齐方法大语言模型编码器注意力图谱关系计算机程序指令生成知识实体对齐模型教师柔性三元组标签掩码矩阵融合策略噪声学生数据

基于大语言模型知识增强的跨语言实体对齐方法

站点导航

APP 下载