摘要
本发明属于医疗数据挖掘和人工智能技术领域,公开了一种基于表示学习的多标签疾病数据分类模型构建方法,在疾病侧及患者侧完善相关信息构成医学知识图谱,将其包含的实体和关系转换为嵌入向量;设计层次化注意力机制提取知识图谱中节点的高阶结构和语义信息,生成目标节点在不同层的嵌入向量;整合不同层的患者节点和疾病节点的嵌入向量,进行数据分类;构建知识图谱损失函数和疾病数据分类损失函数,利用自我对抗性负采样策略,设计基于节点度数的动态采样与损失加权,完成模型的构建。本发明所述方法能够高效利用各类医疗数据,充分挖掘疾病间复杂关系,克服数据稀疏性和类别不平衡问题,提升模型对疾病数据分类的准确性和泛化能力。
技术关键词
数据分类模型
医学知识图谱
节点
实体
疾病
构建知识图谱
注意力机制
关系
邻居
三元组
数据识别分类
对抗性
样本
标签
患者
累积分布函数
超参数
人工智能技术