结合NPL和大模型的医学文本特征提取方法、系统及介质

正文

推荐专利

申请号：CN202510754055

申请日期：2025-06-06

公开号：CN120910255A

公开日期：2025-11-07

类型：发明专利

摘要

本申请公开了一种结合NPL和大模型的医学文本特征提取方法、系统及介质，主要涉及文本特征提取技术领域，用以解决现有的方案需要人工进行深入干预，以手动方式处理和提取其中的关键特征数据的问题。包括：获取脱敏处理后的训练用诊断数据；筛选出关联度最高的预设数量个训练用医学病历文书，获得训练好的BERT模型；将训练好的BERT模型的输出层作为NPL算法的输入层；通过训练好的BERT模型完成处理医学病历文书的数据标注；将标注数据和症状关键词与诊断疾病名称之间的关联关系作为NPL算法的输入，输出实体、实体之间的关系，进而生成结构化数据；利用生成式大模型，生成从结构化数据中提取实体和实体之间的关系的运行脚本。

技术关键词

病历文书文本特征提取方法医学实体关键词提取算法生成结构化数据脚本 BERT模型疾病特征提取系统关系爬虫软件非易失性计算机存储介质校验终端特征提取技术查询界面

系统为您推荐了相关专利信息

一种高仿真脑脓肿教学模拟器及模拟方法

教学模拟器颅内压力监测头部模型医学影像数据脑室引流术

一种多模态跨领域的问答数据构造方法、装置以及设备

数据构造方法问答模板图像文本三元组

一种基于知识增强注意力网络的文本多标签分类方法

多标签分类方法注意力机制文本分类模型知识图谱嵌入方法实体链接算法

一种用于重力储能监控系统的信息安全防护方法及系统

储能监控系统储能系统监控信息安全防护方法重力储能系统历史访问记录

心血管关联监护信息智能推荐方法、装置、设备及介质

智能推荐信息信息智能推荐方法预训练语言模型心血管疾病患者标签

结合NPL和大模型的医学文本特征提取方法、系统及介质

站点导航

APP 下载