摘要
本发明提供一种医学文本中语义结构单元的智能标注方法及系统,涉及数据处理技术领域,该方法包括S1:获取预训练大语言模型,收集含标注信息的医学文本数据并处理成适配格式,经指令微调构建语义结构单元自动识别模型。S2:集成自动识别模型与文本标注工具形成人机交互标注工具,自动标注医学文本数据,网页展示标注信息,组织专家人工校对。S3:收集校对后数据,新数据达预设数量阈值或模型评估指标满足预设条件时,重新训练模型生成新识别模型,并返回执行S2。本发明具有数据驱动、自我进化和人机协同的优点,借助大语言模型降低维护成本,通过自我学习机制增强模型性能,利用人机协同策略解决大模型算法问题并提升标注效率。
技术关键词
结构单元
智能标注方法
语义
标注工具
文本
大语言模型
医学
计算机软件产品
计算机存储介质
人机协同
总线系统
执行存储器存储
指令
格式
标注系统
微调方法
数据处理技术
模型算法
指标
系统为您推荐了相关专利信息
缺陷分析
报告
检索匹配方法
检索策略
存储计算机程序
温度智能调控
微生物肥料
特征提取模块
时序
矩阵