摘要
本发明属于自然语言处理领域,提出了一种基于主动学习的预训练大模型体检文本标注方法及系统。该方法通过以下流程实现:收集整理结构化和非结构化健康体检数据,专家手动预标注少量样本并规范格式;选取适配医学领域任务的预训练大模型;设计领域特异性提示词模板强化模型语义理解;采用监督微调与低秩适应技术进行参数优化;构建主动学习闭环,通过多轮迭代训练选择不确定性样本补充标注,并利用验证集动态优化模型;应用优化后模型对剩余数据进行智能标注。本方案解决了传统手工标注效率低、规则方法泛化能力差、机器学习模型算力需求高以及大模型领域适配不足的关键问题,能有效提升体检报告中病理特征、临床指标等医学实体的自动化提取精度。
技术关键词
文本标注系统
文本标注方法
主动学习策略
样本
更新模型参数
矩阵
格式
标签
检查点技术
模型库
标注平台
优化器
微调方法
梯度下降法
健康体检数据
模型更新
注意力机制
系统为您推荐了相关专利信息
候选肿瘤标志物
组合检测方法
样本
指标
机器学习算法
图像脱敏方法
语义特征
车载终端
视频帧解码
上采样
山洪灾害风险
节点特征
知识图谱架构
构建知识图谱
数据
电能表运行状态
下电能表
状态评估方法
LSTM模型
电能表状态