摘要
本公开提供了数据增强方法及其装置,涉及数据处理技术领域,尤其涉及大数据、自然语言处理等技术领域。该方法包括:获取目标业务领域的第一文本数据,基于第一文本数据生成第一查询语句和第一结构化查询语句;对包含第一文本数据、第一查询语句和第一结构化查询语句的初始数据集进行多次数据增强,得到候选数据集,数据集中的文本数据、查询语句和结构化查询语句为三元组数据格式;判断候选数据集中是否具有未满足预设约束条件的待处理数据,响应于候选数据集中具有待处理数据,基于约束条件对待处理数据进行数据修改,得到目标数据集。本公开可以提高数据增强的效率和准确率,提升对应的数据质量,得到有效的结构化查询语句。
技术关键词
结构化查询语句
文本
三元组
信息更新
数据获取模块
数据格式
语义
数据处理技术
计算机程序产品
处理器通信
自然语言
指令
关系
可读存储介质
存储器
系统为您推荐了相关专利信息
地理空间信息数据
数据采集方法
多源数据融合技术
数据融合算法
数据分析方法
机械臂关节
智能抓取
语言编码器
语义向量
多模态
样本分类方法
预训练模型
视觉特征提取
分支
图像多模态