基于提示调优的集成式主动学习科学文本分类方法及系统

正文

推荐专利

申请号：CN202411498523

申请日期：2024-10-25

公开号：CN119494013A

公开日期：2025-02-21

类型：发明专利

摘要

本发明涉及一种基于提示调优的集成式主动学习科学文本分类方法及系统，该方法包括：获取有标签的第一文本数据集、未标记的第二文本数据集和有标签的第三文本数据集，使用第一文本数据集对提前构建的文本分类模型进行预训练；基于预训练后的文本分类模型，对第二文本数据集进行预测，根据每个样本数据的预测标签的置信度，得到从第二文本数据集中筛选出置信度具有训练价值的样本数据，并对其进行标记；利用标记后的第四文本数据集更新第一文本数据集；在每一次利用更新后的第一文本数据集训练下一轮的文本分类模型中，若满足停止迭代条件，得到训练好的文本分类模型。本发明在数据利用效率、模型性能提升以及自动化程度方面都表现出了显著的优势。

技术关键词

文本分类模型文本分类方法标签标记非暂态计算机可读存储介质样本文本分类系统模型预训练分类设备模板处理器数据更新模块存储器程序指令参数

系统为您推荐了相关专利信息

利用方向辅助增强算法的移动机器人路径规划方法及系统

网格移动机器人地图邻域算法

一种基于检索增强生成和思维链技术的视觉推理方法

文本特征向量图像特征向量推理方法感兴趣生成技术

超分辨率方法

图像增强像素查找表超分辨率方法网络模型训练

网页信息的提取方法、装置及电子设备

标签电子设备节点分类模型识别可读存储介质

多仓协同下的货物进出信息管理方法、设备及电子介质

信息管理方法管理策略货物管理技术列表模型库

基于提示调优的集成式主动学习科学文本分类方法及系统

站点导航

APP 下载