摘要
本发明公开基于标签不变性的上下文数据增强方法,属于自然语言处理技术领域。该方法包括:步骤S1、对输入的原始文本进行id映射,再进行随机顺序打乱,并选择指定数量的字符,作为后续进行数据增强的目标文本;步骤S2、利用改变嵌入层向量的Bert模型和双向LSTM模型,对目标文本执行保留分类标签信息的文本编码处理和上下文特征提取;步骤S3、将提取出的特征向量分别经池化操作、自编码器和去噪自编码器进行变换并进行拼接,通过反向解码生成增强文本作为输出。
技术关键词
编码器
文本
标签
字符
数据
BiLSTM模型
处理单元
可读存储介质
解码
神经网络模型
噪声
电子设备
自然语言
处理器
同义词
标记
语义
存储器
系统为您推荐了相关专利信息
分布式存储系统
稳定性测试方法
测试用例集
系统稳定性测试
多线程
变换器控制方法
车载电源
时间段
变换器控制系统
训练强化学习神经网络
调度请求消息
服务端
调度请求信息
调度装置
KV数据库
空调负荷预测
室内空调负荷
模型建立方法
负荷预测模型
空调运行数据