摘要
本发明提供了一种基于大语言模型迁移学习的ICD自动编码的方法及系统,包括:输入低资源语言的电子病历数据,使用大语言模型,识别待编码文本的类型;基于待编码的内容,构建多语言ICD自动编码指令;使用语言迁移ICD自动编码大模型,对待编码内容进行ICD自动编码,输出I CD编码结果;基于低资源语言的编码规则,对输出的ICD编码结果进行验证与对齐,输出最终编码结果。本发明利用大语言模型的多语言能力,对于低资源语言环境下获取人工标注数据较难的ICD自动编码任务,有效减少了人工标注工作量、降低大语言模型在I CD编码任务上的落地成本。
技术关键词
低资源语言
大语言模型
电子病历数据
多语言
编码规则
文本
自动编码系统
指令
定义标签
模板
模块
字典
语句
可读存储介质
系统为您推荐了相关专利信息
多模态交互反馈
驾驶习惯数据
场景
车辆传感器数据
运动矢量分析