摘要
本发明公开了一种文本处理模型的训练方法、装置、设备和存储介质。一种文本处理模型的训练方法,包括:获取样本集,样本集中包括文本样本数据;基于样本集中的文本样本数据对待训练的第一文本处理模型进行训练,并确定文本样本数据中的待扩增样本数据;待扩增样本数据经第一文本处理模型处理得到的处理数据满足第一设定条件;通过已训练的第二文本处理模型,对待扩增样本数据进行扩增处理,得到至少一个扩增样本数据,基于扩增样本数据更新样本集;基于更新后的样本集对第一文本处理模型继续进行训练,直到得到训练好的第一文本处理模型。通过自动生成样本数据,解决样本集获取困难的问题,增加样本集的多样性,提高第一文本处理模型的泛化能力。
技术关键词
文本处理模型
标签
数据更新
生成样本数据
可读存储介质
计算机
训练装置
电子设备
处理器通信
模块
存储器
指令
系统为您推荐了相关专利信息
水电站机组
状态监控方法
故障特征
训练样本集
故障诊断模型
负载均衡方法
报文
网络
负载均衡装置
负载均衡算法
数据处理模块
冷冻电镜
自动编码器
预训练模型
结构生物学研究
需求响应控制方法
电力负荷预测模型
电力设备
粒子群优化算法
电网运行参数