摘要
本发明公开了一种主动学习过程中的学习样本的选择方法,包括:采用预训练模型对原始数据进行一次性特征嵌入,并通过微型神经网络进行迭代样本数据的选择;基于所述迭代样本数据,基于所述微型神经网络及样本池化过程进行多轮迭代选择处理过程,实现学习样本的选择。本发明的实现使得使用轻量级神经网络便可以直接预测样本的信息丰富程度,同时还可以根据历史的信息丰富程度衡量结果缩小每一轮样本信息丰富度衡量的候选样本,从而解决当未标注数据量庞大时存在的数据选择耗时久的问题,以实现使用较少的标注时间预算得到高正确率的任务模型。
技术关键词
样本
轻量级神经网络
数据
预训练模型
流水线
自然语言
正确率
度量
文本
基准
策略
阶段
系统为您推荐了相关专利信息
评价指标体系
综合评价指数
生态环境影响
评价方法
景观破碎度指数
智能监测方法
语音特征数据
视觉特征
多模态数据采集
指标
智能构建方法
多层次
空间拓扑结构
原型
上下文特征
液压控制系统
浮动油缸
液压控制单元
故障诊断算法
油液