摘要
本申请公开了一种结合NPL和大模型的医学文本特征提取方法、系统及介质,主要涉及文本特征提取技术领域,用以解决现有的方案需要人工进行深入干预,以手动方式处理和提取其中的关键特征数据的问题。包括:获取脱敏处理后的训练用诊断数据;筛选出关联度最高的预设数量个训练用医学病历文书,获得训练好的BERT模型;将训练好的BERT模型的输出层作为NPL算法的输入层;通过训练好的BERT模型完成处理医学病历文书的数据标注;将标注数据和症状关键词与诊断疾病名称之间的关联关系作为NPL算法的输入,输出实体、实体之间的关系,进而生成结构化数据;利用生成式大模型,生成从结构化数据中提取实体和实体之间的关系的运行脚本。
技术关键词
病历文书
文本特征提取方法
医学
实体
关键词提取算法
生成结构化数据
脚本
BERT模型
疾病
特征提取系统
关系
爬虫软件
非易失性计算机存储介质
校验终端
特征提取技术
查询界面
系统为您推荐了相关专利信息
教学模拟器
颅内压力监测
头部模型
医学影像数据
脑室引流术
多标签分类方法
注意力机制
文本分类模型
知识图谱嵌入方法
实体链接算法
储能监控系统
储能系统监控
信息安全防护方法
重力储能系统
历史访问记录
智能推荐信息
信息智能推荐方法
预训练语言模型
心血管疾病患者
标签