摘要
本发明涉及一种基于提示调优的集成式主动学习科学文本分类方法及系统,该方法包括:获取有标签的第一文本数据集、未标记的第二文本数据集和有标签的第三文本数据集,使用第一文本数据集对提前构建的文本分类模型进行预训练;基于预训练后的文本分类模型,对第二文本数据集进行预测,根据每个样本数据的预测标签的置信度,得到从第二文本数据集中筛选出置信度具有训练价值的样本数据,并对其进行标记;利用标记后的第四文本数据集更新第一文本数据集;在每一次利用更新后的第一文本数据集训练下一轮的文本分类模型中,若满足停止迭代条件,得到训练好的文本分类模型。本发明在数据利用效率、模型性能提升以及自动化程度方面都表现出了显著的优势。
技术关键词
文本分类模型
文本分类方法
标签
标记
非暂态计算机可读存储介质
样本
文本分类系统
模型预训练
分类设备
模板
处理器
数据更新
模块
存储器
程序
指令
参数
系统为您推荐了相关专利信息
文本特征向量
图像特征向量
推理方法
感兴趣
生成技术
图像增强
像素
查找表
超分辨率方法
网络模型训练
信息管理方法
管理策略
货物管理技术
列表
模型库