摘要
本公开提供了一种数据增强方法和装置,具体实现方案为:对原始文本中的任意一个或多个原始分词进行掩码处理,得到中间文本,中间文本包括掩码处理后的原始分词和原始文本中除原始分词之外的其他分词;在确定原始文本的意图和中间文本的意图不一致的情况下,确定对应的一个或多个原始分词为需要调整的第一目标分词;根据对第一目标分词进行调整得到的替换分词,以及原始文本中除第一目标分词之外的其他分词,生成第一增强文本。
技术关键词
分词
关键词
字符
意图分类模型
文本生成模型
数据
模块
标签
系统为您推荐了相关专利信息
多动症儿童
交互机器人
语音识别模块
语音特征
脑电波传感器
查询关键词
特征提取方法
视频帧
视频片段定位方法
检索定位方法
核酸序列数据
重复序列
生物信息学技术
算法
格式