摘要
本发明提供的基于NL2SQL的大语言模型构建方法以及装置,包括:获取原始数据集,对原始数据集进行预处理,以得到预处理后的原始数据集,确定预处理后的原始数据集中段落之间的逻辑关系,将逻辑关系相同的段落进行合并,以得到合并之后的数据集,提取合并之后的数据集中的关键信息,基于关键信息,构建训练数据集,其中,训练数据集包括多个问题以及每个问题对应的SQL语句,基于训练数据集,对大语言模型进行训练,以得到训练后的大语言模型。通过分析原始数据集中段落之间的逻辑关系,精简段落并提高提取短路中关键信息的效率。基于关键信息构建训练数据集,有效提升NL2SQL的准确性,降低数据集构建的难度,增强系统的实用性。
技术关键词
语言模型构建方法
数据
语句
文本
模型构建装置
字段
语义
索引
大语言模型
关系
模块
模板
动态
短路
系统为您推荐了相关专利信息
图像分割模型
医学影像数据
像素
医学图像分割方法
条件随机场
智能预警方法
智能模型
空间地理数据
构建高分辨率
数值
模拟预测方法
集成算法
城市道路
长短期记忆网络
随机森林模型
配电系统
历史运行状态
智能调度算法
策略
多层次特征