摘要
本发明涉及一种基于自监督学习的中医证候预测模型预训练方法和系统,属于医疗保健信息处理技术领域,解决了现有技术中特征提取不准确的问题。方法包括以下步骤:收集患者症状描述信息,基于获取的患者症状描述信息构建症状语料库及训练样本集;基于所述症状语料库对所述训练样本集中的每条原始样本进行数据增强,生成每条原始样本对应的合成正样本和合成负样本;构建自监督学习模型,基于增强后的训练样本集对所述自监督学习模型进行预训练,得到中医证候预测预训练模型。实现了更准确的特征提取,提高后续任务的性能。
技术关键词
监督学习模型
预训练方法
训练样本集
深度编码
预训练模型
深度特征提取
模型预训练
解码器
编码器
患者
信息处理技术
模型训练模块
数据
语义
词语
聚类
参数