摘要
本发明提供了一种训练数据的生成方法、模型的训练方法、知识图谱补全方法以及电子设备。本发明通过引入基于实体相似度的正采样机制和多级验证的负采样优化方法,有效解决了稀疏实体训练失真和负采样噪声干扰问题。具体地,首先通过将原始知识图谱中的实体划分为稀疏实体和稠密实体集合,利用稠密实体的语义信息为稀疏实体生成高置信度的正三元组,提升了稀疏实体的嵌入表示质量。其次,通过基于重要性的负采样算法,生成了具有高训练价值的负三元组,避免了假负例的干扰,从而提高了模型训练的效果和准确性。
技术关键词
实体
知识图谱数据
三元组
知识图谱补全方法
关系预测模型
样本
生成方法
评分方法
采样方法
生成训练数据
算法
电子设备
处理器
存储器
邻居
指令
系统为您推荐了相关专利信息
信息处理方法
信息处理系统
物流跟踪系统
非结构化文本
风险
电网设备监控
混合模型构建方法
电网设备模型
模型训练算法
专业