深度NLP模型用于医药文档关键信息提取的系统及方法

正文

推荐专利

申请号：CN202510458700

申请日期：2025-04-14

公开号：CN119988646B

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了深度NLP模型用于医药文档关键信息提取的系统及方法，涉及自然语言处理技术领域，本方法包括以下步骤：收集多源数据，清洗噪声并依标准术语库对齐，构建原始语料库、标准化实体词典以及关键信息本体库；用预训练模型BioBERT对标注数据集适配调整，根据任务训练多任务NLP模型，基于高频术语优化模型权重；以优化模型处理新文档，经阈值过滤、聚类分析，专家验证后更新本体库，补充新术语及标注；混合新旧标注数据，用EWC算法增量更新模型；解析新文档，构建动态医药知识图谱。本发明能够有效改善现有技术中领域新知识和新术语无法快速纳入模型导致模型难以及时更新的情况。

技术关键词

术语医药知识图谱知识图谱构建动态知识图谱增量更新输入端文本编码器数据采集单元模型更新词典模块多任务实体支持增量训练预训练模型语义向量注意力

系统为您推荐了相关专利信息

基于大语言模型的虚假资讯识别语言模型

大语言模型知识图谱构建数据采集单元样本参数更新模块

一种基于无线AI架构的多语言智能会议系统及其信息处理方法

智能会议系统会议信息处理方法 AI服务器语音识别模块客户端

一种智能客户关系知识图谱构建方法

知识图谱构建方法差分隐私技术保护敏感信息 BERT模型更新知识图谱

一种基于大数据驱动的资讯信息匹配推送方法及系统

匹配推送方法大数据企业内部数据实体识别模型企业画像

基于特征融合的音频解析方法、装置、设备及介质

融合特征解析方法语义文本音乐

深度NLP模型用于医药文档关键信息提取的系统及方法

站点导航

APP 下载