基于标签不变性的上下文数据增强方法

AITNT
正文
推荐专利
基于标签不变性的上下文数据增强方法
申请号:CN202411597802
申请日期:2024-11-11
公开号:CN119990068A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开基于标签不变性的上下文数据增强方法,属于自然语言处理技术领域。该方法包括:步骤S1、对输入的原始文本进行id映射,再进行随机顺序打乱,并选择指定数量的字符,作为后续进行数据增强的目标文本;步骤S2、利用改变嵌入层向量的Bert模型和双向LSTM模型,对目标文本执行保留分类标签信息的文本编码处理和上下文特征提取;步骤S3、将提取出的特征向量分别经池化操作、自编码器和去噪自编码器进行变换并进行拼接,通过反向解码生成增强文本作为输出。
技术关键词
编码器 文本 标签 字符 数据 BiLSTM模型 处理单元 可读存储介质 解码 神经网络模型 噪声 电子设备 自然语言 处理器 同义词 标记 语义 存储器
系统为您推荐了相关专利信息
1
一种分布式存储系统的稳定性测试方法、装置、设备及存储介质
分布式存储系统 稳定性测试方法 测试用例集 系统稳定性测试 多线程
2
分布式负载自均衡DC/DC车载电源变换器控制方法及系统
变换器控制方法 车载电源 时间段 变换器控制系统 训练强化学习神经网络
3
一种基于智能风控模型的企业信用评估方法
企业信用评估方法 数据 风控模型 偏差 数值
4
模型推理的调度方法、装置、系统、介质、产品及设备
调度请求消息 服务端 调度请求信息 调度装置 KV数据库
5
空调负荷预测模型建立方法、系统及储存介质
空调负荷预测 室内空调负荷 模型建立方法 负荷预测模型 空调运行数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号