摘要
本发明涉及大模型技术领域,具体为一种运维行业NL2SQL大模型训练集构建方法及系统,包括以下步骤:字段筛选与枚举值生成;种子数据集构建;训练集扩展;模型优化迭代;SQL生成规则映射;有益效果为:通过运维工作人员提供的能覆盖常用场景的问题(以下简称种子问题)列表,以及种子问题对应的查询SQL(以下简称种子SQL),构建与种子问题语义相似的问题模板(以下简称扩展问题模板)列表,然后执行训练集构建脚本,脚本会根据数据库表字段的枚举值对种子问题、种子SQL和扩展问题模板中的内容进行替换,实现NL2SQL大模型训练集的快速构建。
技术关键词
训练集
数据格式
种子
字段
SQL模板
列表
生成规则
字典结构
自然语言
构建系统
运维
笛卡尔
扩展模块
策略
定义
生成训练样本
语义
系统为您推荐了相关专利信息
模型管理系统
仿真模型
分布式物联网
仿真系统
仿真设备
联合损失函数
样本
生成网络模型
注意力
MRI切片
账户异常登录
安全监控方法
金融
长短期记忆神经网络
多层感知机