摘要
本发明公开了一种基于知识图谱的链路预测方法,步骤包括:获取医药数据集;基于预训练得到的嵌入向量和设计的高质量候选负样本集构建策略,为所有正三元组采样高质量的候选负样本集;根据不同的知识图谱嵌入模型,计算三元组及其对应的负三元组的评分函数值;统计出数据集中的相关频次数据,计算每个三元组的基于频次的权重;根据评分函数值以及权重,计算三元组集的损失L,得到训练框架最终的损失函数;采用随机梯度下降法来优化训练模型的损失函数;输出药物与疾病、症状之间的潜在关联关系。本申请提升模型的负采样质量,通过对损失函数进行加权缓解长尾实体、关系对模型训练造成的不良影响,提高模型训练性能。
技术关键词
三元组
链路预测方法
实体
图谱
样本
关系
随机梯度下降
预训练模型
动态更新
数据
定义
语义
因子
嵌入框架
策略
疾病
药物
医药
系统为您推荐了相关专利信息
训练数据处理方法
零样本学习算法
高维特征向量
互联网
评分方法
锂电池极片缺陷
特征提取模块
特征提取单元
图像采集模块
样本
棉花黄萎病
等级识别方法
棉花植株
残差模块
图像
文本处理方法
大语言模型
列表
文本处理系统
校正