摘要
本申请公开了一种NL2SQL数据集构建方法、装置、设备及介质,涉及人工智能技术领域,包括:对当前的待处理数据库进行结构分析得到结构分析结果;基于预设大模型、预设提示工程及结构分析结果生成种子数据集;种子数据集包括相应的若干个种子问题及与各种子问题分别对应的目标SQL语句;基于预设大模型及预设提示工程对各种子问题进行语义扩充,得到扩充后数据集;通过预设语句检验规则对扩充后数据集中与扩充后问题对应的扩充后SQL语句进行验证、筛选,得到与待处理数据库对应的目标NL2SQL数据集,以便基于目标NL2SQL数据集完成与预设数据处理模型对应的模型训练操作。能够有效提高NL2SQL数据集的准确性和多样性。
技术关键词
数据集构建方法
语句
数据处理模型
种子
语义
扩充模块
人工智能技术
训练集
分析模块
可读存储介质
处理器
电子设备
字段
存储器
计算机
关系
系统为您推荐了相关专利信息
智能管理方法
深度学习技术
机器学习模型
非易失性存储介质
指标
文本检测方法
语义特征
注意力机制
多尺度卷积神经网络
融合特征
安全帽佩戴检测
场景特征
语义分割网络
分割方法
卷积残差网络