摘要
本申请公开了一种医学文本的分类方法及装置,包括:获取待分类医学文本;对待分类医学文本进行嵌入处理,得到待分类医学文本的嵌入;将待分类医学文本的嵌入输入至预先训练好的集成编码器中,得到第一分类结果和第二分类结果;其中,集成编码器由BERT编码器及其对应的全连接层和ERNIE编码器及其对应的目标全连接层组合构成;集成编码器预先利用增强医学文本数据集进行训练得到;对第一分类结果和第二分类结果进行投票处理,得到最终分类结果。从而利用增强后的医学文本数据对多个编码器进行编码并得到相应的分类结果,并且对所有分类结果进行投票,能够实现对医学文本进行大规模的高效分类,进而还有效地提高分类的准确性。
技术关键词
集成编码器
文本
医学
数据
大语言模型
处理单元
实体
网络向量
注意力机制
分类方法
融合算法
样本
优化器
异构
分类装置
模块
参数