摘要
本发明公开了一种SQL数据集生成方法及装置,涉及人工智能技术领域。所述方法包括:对文本数据进行信息提取处理,得到包括复杂度分布、业务规则以及查询模式的结构化文本数据;基于结构化文本数据,构建多个候选问答对;针对每个候选问答对,基于候选SQL语句在执行维度、匹配维度以及语法维度上的维度得分以及候选问题的复杂级别,计算第一质量得分;计算候选SQL语句在文本单元以及子句层级上的置信度,得到第二质量得分;融合第一质量得分以及第二质量得分,确定目标SQL数据集。本发明可确保快速生成高质量的目标SQL数据集。
技术关键词
文本
语句
数据库结构
大语言模型
复杂度
清洗规则
生成方法
语法结构
层级
模式
模板组合
人工智能技术
因子
生成装置
策略
模块
格式
基础
系统为您推荐了相关专利信息
文本编码器
语音特征
解码器
计算机设备
TTS系统
数据资产化方法
构建知识图谱
机器学习算法
实体
企业
食谱生成方法
多源异构数据
实体关联关系
医学知识图谱
时序预测模型
标识符
文本生成方法
集成门控
模块
计算机可执行指令