摘要
本说明书提供一种Text2SQL数据集的生成方法和系统,包括:获得输入数据,输入数据包括数据库模式、自然语言问题样本、以及与自然语言问题样本对应的目标标注特征,根据输入数据生成与自然语言问题样本对应的类似问题,根据数据库模式和类似问题生成与类似问题对应的目标SQL查询、以及与目标SQL查询对应的目标执行结果。其中,Text2SQL数据集包括类似问题、目标SQL查询、目标执行结果。可以提高生成Text2SQL数据集的灵活性和多样性,从而使得Text2SQL数据集具有较大的规模性和较好的丰富性。
技术关键词
自然语言
大语言模型
语义特征
种子
样本
模式
数据
生成方法
实体
字段
生成系统
规模性
特征值
处理器
度量
逻辑
通讯
关系