摘要
本发明公开了基于负采样和加权的知识图谱嵌入方法,步骤包括:获取医药数据集;基于预训练得到的嵌入向量和设计的高质量候选负样本集构建策略,为所有正三元组采样高质量的候选负样本集;根据基于翻译的知识图谱嵌入模型,计算三元组及其对应的负三元组的评分函数值;统计出数据集中的相关频次数据,计算每个三元组的基于频次的权重;根据评分函数值以及权重,计算三元组集的损失L,得到训练框架最终的损失函数;采用随机梯度下降法来优化训练模型的损失函数;输出药物与疾病、症状之间的潜在关联关系。本申请提升模型的负采样质量,通过对损失函数进行加权缓解长尾实体、关系对模型训练造成的不良影响,提高模型训练性能。
技术关键词
三元组
知识图谱嵌入方法
实体
样本
关系
随机梯度下降
预训练模型
动态更新
数据
因子
嵌入框架
策略
定义
医药
疾病
药物
超参数
系统为您推荐了相关专利信息
医疗知识图谱
数据处理方法
骨科
强化学习模型
数据处理程序
掩模图形
检查规则
掩模版图
计算机程序指令
关系
钢轨表面缺陷
卷积神经网络模型
图像特征信息
定位方法
残差卷积神经网络
关键词
大语言模型
对象预测方法
计算机执行指令
标签预测值