摘要
一种基于大语言模型的电子病历后结构化信息提取方法、电子设备及存储介质,属于医疗数据处理技术领域,该信息提取方法包括模型训练及所训练模型的应用,模型训练的步骤为:步骤a,对电子病历进行后结构化标注;步骤b,对电子病历数据进行处理;步骤c,将电子病历数据拆分为若干个元素,将所得元素组织为训练样本数据;步骤d,以训练样本数据对大语言模型进行训练/微调;所训练模型的应用是对微调后的电子病历后结构化训练模型进行应用。本发明将电子病历后结构化的数据标注进行元素拆分、处理,以使应用模型时输出的单词、短语或字符序列数量减少,模型的任务更明确,并约束输出的内容,从而提高了模型的输出效率、提升输出的正确性。
技术关键词
电子病历后结构化
信息提取方法
大语言模型
电子病历数据
训练样本数据
元素
文本
医疗数据处理技术
电子设备
存储计算机程序
组织
处理器
存储器
可读存储介质
格式
字符
序列
系统为您推荐了相关专利信息
大语言模型
问答系统构建方法
审核规则
数据
模块
冠状动脉血管造影
手术
CT扫描系统
报告
大语言模型
图像生成方法
大语言模型
主题
文本
GrabCut算法