摘要
本发明适用于数据信息处理技术领域,提供了一种基于大语言模型的医学论文关键信息提取方法,包括T1、构建医学论文词典库;T2、对神经网络模型进行训练以及调整,生成目标语言模型;T3、构建目标语句块;T4、基于多组目标语句块生成关键信息;T5、确定待处理语句中的关键词;T6、基于生成的关键信息与待处理语句中确定的关键词,提取医学沦为词典库中与两者相近的医学论文;该关键信息提取方法通过将预先训练的语言模型作为待处理语句的特征提取工具,并添加词性特征、词典特征等丰富的底层信息来扩大词的差异化,使得待处理语句中关键词和非关键词的差异较为明确,通过生成结构化的关键信息,能够显著提升医学论文提取和分析效率。
技术关键词
关键信息提取方法
大语言模型
关键词
语句
词典
语义向量
BERT模型
神经网络模型
数据信息处理技术
特征提取工具
训练神经网络
特征提取模型
CRF模型
语义特征
医学
聚类
算法
系统为您推荐了相关专利信息
非结构化文档
知识图谱构建系统
智能推理
数据存储模块
文本
word2vec模型
投资者
量化评估方法
量化评估系统
词典