摘要
本发明公开了一种基于多通道BiLSTM的疾病表型分类方法及系统,涉及智能医疗技术领域;将MIMIC‑III数据集中的数据划分为结构化数据和分结构化数据。结构化数据,分别用连续向量和独热向量的形式表示其中的连续数值和分类数值;非结构化数据,分别采用BOW、BOC、Doc2Vec和ClinicalBERT方式生成每个临床笔记的文档级表示,将结构数据和非结构化数据以独立或拼接形式送入多通道BiLSTM模型中,模型包括BiLSTM模块、多通道处理模块和深度监督模块,BiLSTM模块用于捕捉单一通道时间序列数据的全局理解,多通道处理模块用于整合多个通道的时序特征,获得长度为25的二进制向量表示。之后在深度监督模块的加持下,通过损失函数快速缩小预测结果与真实标签之间的差距,提高模型准确率,降低误报率。
技术关键词
BiLSTM模型
多通道
分类方法
疾病
时序特征
序列
智能医疗技术
记忆特征
复制方法
变量
数据处理模块
中间层
分类系统
数值
标签
代表
超参数