Text2SQL数据集的生成方法和系统

AITNT
正文
推荐专利
Text2SQL数据集的生成方法和系统
申请号:CN202511236024
申请日期:2025-08-29
公开号:CN121029792A
公开日期:2025-11-28
类型:发明专利
摘要
本说明书提供一种Text2SQL数据集的生成方法和系统,包括:获得输入数据,输入数据包括数据库模式、自然语言问题样本、以及与自然语言问题样本对应的目标标注特征,根据输入数据生成与自然语言问题样本对应的类似问题,根据数据库模式和类似问题生成与类似问题对应的目标SQL查询、以及与目标SQL查询对应的目标执行结果。其中,Text2SQL数据集包括类似问题、目标SQL查询、目标执行结果。可以提高生成Text2SQL数据集的灵活性和多样性,从而使得Text2SQL数据集具有较大的规模性和较好的丰富性。
技术关键词
自然语言 大语言模型 语义特征 种子 样本 模式 数据 生成方法 实体 字段 生成系统 规模性 特征值 处理器 度量 逻辑 通讯 关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号