摘要
本发明一种原文拆解和标签识别方法、系统、设备及存储介质。原文拆解和标签识别方法包括:将原文件输入到预先训练好的预训练模型中,获得文本标签向量;将文本向量输入到预先训练好的管道模型中,分别获得多个类别的标签、实体BIO序列和每个标签中的逻辑关系,管道模型包括多标签分类模型、实体识别模型和多类别分类模型;通过规则模型对多个类别的标签、实体BIO序列和每个标签中的逻辑关系进行关键词识别和单位识别,获得识别结果。本发明通过三种模型组成管道模型,每一个模型的输出都是下一模型的输入,减少单独训练每个任务模型的成本,再通过管道模型中每个模型输出的结果对原文件中每个标签的单位进行识别,提高了识别原文件的范围和准确率。
技术关键词
标签识别方法
计算机可执行指令
实体识别模型
预训练模型
文本
多标签
关键词
序列
管道
标签识别系统
处理器
可读存储介质
识别标签
电子设备
识别模块
存储器
数据
系统为您推荐了相关专利信息
情感分析方法
局部特征提取
文本
全局特征提取
语音
检查报告生成方法
编码向量
大语言模型
患者
关键字
蛋白相互作用网络
计算机可执行指令
疾病
关键性
蛋白互作网络