摘要
本发明提供一种训练数据的获取方法、病历结构化模型的训练方法、装置及病历结构化设备,涉及计算机人工智能技术领域。所述方法包括将待处理英文病历集中的医学行话和医学术语缩写还原为对应的全称,得到还原后英文病历集;将还原后英文病历集翻译为中文,得到中文翻译病历集;对还原后英文病历集中每篇还原后英文病历进行医学术语识别和属性信息提取,得到每篇还原后英文病历的英文结构化数据;将每篇还原后英文病历的英文结构化数据与对应的中文翻译病历集中的中文翻译病历进行信息对应,得到中文训练数据。该方法能够根据英文电子病历数据集构造准确的中文结构化数据用于模型训练,提升了获取中文训练数据的效率和准确度。
技术关键词
术语
医学
中文电子病历
大语言模型
计算机人工智能技术
字典树
电子病历数据
数据模块
文本
基础
数据获取模块
训练装置
关系
存储器
核心
处理器
系统为您推荐了相关专利信息
蓝牙传输模块
传感器模组
评估装置
柔性压力传感
算法模块
客户端页面
交互组件
元素
意图识别
计算机可执行指令
生成对抗网络
卷积神经网络参数
卷积神经网络结构
图像超分辨率
数据
分词
文章特征
热点事件检测方法
无监督特征
预训练语言模型
图像采集速度
造影辅助装置
医学图像处理技术
解码器
分类网络