摘要
本发明属于医疗ICD自动编码领域,具体涉及一种基于图神经网络的医疗ICD编码分类方法,包括获取数据集并进行预处理得到文本向量矩阵;根据文本向量矩阵构建图结构,所述图结构包括节点特征矩阵和邻接矩阵;将图结构输入图神经网络模型输出预测ICD编码结果,采用基于交叉熵的多标签损失函数对模型进行训练;将待编码的病历数据输入训练好的图神经网络模型,得到预测ICD编码;本发明将医疗术语间的语义相似度、ICD编码间的层次距离和共现频率关系纳入图结构中,能够全面地捕捉词语及标签之间的复杂关系,更好地利用了ICD编码间的潜在关联性,增强了分类模型的上下文理解能力和准确性。
技术关键词
编码分类方法
神经网络模型
文本
节点特征
语义
病历
矩阵
频率
样本
标签
自动编码
注意力机制
定义
术语
词语
邻居
数据