摘要
本申请提供了一种基于错误修正和偏好优化的NL2SQL大模型训练方法,涉及自然语言处理技术领域,包括:将适配数据库的数据集输入到开源大模型,并对生成数据进行验证,对验证失败的错误数据进行收集;通过闭源大模型将所述错误数据进行修正,以得到修正数据;将所述错误数据和所述修正数据与查询需求相关联,以形成训练样本;采用直接偏好优化策略,利用所述训练样本,对所述开源大模型进行有监督微调。
技术关键词
模型训练方法
自然语言
数据库结构
语句
SQL语法
更新模型参数
策略
计算机程序产品
处理器
数据标签
样本
格式
解析器
数据存储
可读存储介质
关键字
指令
执行器