基于标签不变性的上下文数据增强方法

正文

推荐专利

基于标签不变性的上下文数据增强方法

申请号：CN202411597802

申请日期：2024-11-11

公开号：CN119990068A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开基于标签不变性的上下文数据增强方法，属于自然语言处理技术领域。该方法包括：步骤S1、对输入的原始文本进行id映射，再进行随机顺序打乱，并选择指定数量的字符，作为后续进行数据增强的目标文本；步骤S2、利用改变嵌入层向量的Bert模型和双向LSTM模型，对目标文本执行保留分类标签信息的文本编码处理和上下文特征提取；步骤S3、将提取出的特征向量分别经池化操作、自编码器和去噪自编码器进行变换并进行拼接，通过反向解码生成增强文本作为输出。

技术关键词

编码器文本标签字符数据 BiLSTM模型处理单元可读存储介质解码神经网络模型噪声电子设备自然语言处理器同义词标记语义存储器

系统为您推荐了相关专利信息

一种分布式存储系统的稳定性测试方法、装置、设备及存储介质

分布式存储系统稳定性测试方法测试用例集系统稳定性测试多线程

分布式负载自均衡DC/DC车载电源变换器控制方法及系统

变换器控制方法车载电源时间段变换器控制系统训练强化学习神经网络

一种基于智能风控模型的企业信用评估方法

企业信用评估方法数据风控模型偏差数值

模型推理的调度方法、装置、系统、介质、产品及设备

调度请求消息服务端调度请求信息调度装置 KV数据库

空调负荷预测模型建立方法、系统及储存介质

空调负荷预测室内空调负荷模型建立方法负荷预测模型空调运行数据

基于标签不变性的上下文数据增强方法

站点导航

APP 下载