一种基于大语言模型的医学论文关键信息提取方法

正文

推荐专利

申请号：CN202411727455

申请日期：2024-11-28

公开号：CN119558310A

公开日期：2025-03-04

类型：发明专利

摘要

本发明适用于数据信息处理技术领域，提供了一种基于大语言模型的医学论文关键信息提取方法，包括T1、构建医学论文词典库；T2、对神经网络模型进行训练以及调整，生成目标语言模型；T3、构建目标语句块；T4、基于多组目标语句块生成关键信息；T5、确定待处理语句中的关键词；T6、基于生成的关键信息与待处理语句中确定的关键词，提取医学沦为词典库中与两者相近的医学论文；该关键信息提取方法通过将预先训练的语言模型作为待处理语句的特征提取工具，并添加词性特征、词典特征等丰富的底层信息来扩大词的差异化，使得待处理语句中关键词和非关键词的差异较为明确，通过生成结构化的关键信息，能够显著提升医学论文提取和分析效率。

技术关键词

关键信息提取方法大语言模型关键词语句词典语义向量 BERT模型神经网络模型数据信息处理技术特征提取工具训练神经网络特征提取模型 CRF模型语义特征医学聚类算法

系统为您推荐了相关专利信息

基于提示词的知识图谱构建系统与方法

非结构化文档知识图谱构建系统智能推理数据存储模块文本

一种基于多维度特征融合的APT异常行为检测方法

节点语义结构融合特征进程邻域

结合多模态知识图谱和多模态大语言模型的信息检测方法

大语言模型信息检测方法多模态实体文本

基于机器学习的投资者对ESG关注度的量化评估方法及系统

word2vec模型投资者量化评估方法量化评估系统词典

一种基于乡村数据的区块链可视化方法及系统

板块可视化方法加密数据关键词民生数据

一种基于大语言模型的医学论文关键信息提取方法

站点导航

APP 下载