一种基于错误修正和偏好优化的NL2SQL大模型训练方法

正文

推荐专利

申请号：CN202510305859

申请日期：2025-03-14

公开号：CN120235210A

公开日期：2025-07-01

类型：发明专利

摘要

本申请提供了一种基于错误修正和偏好优化的NL2SQL大模型训练方法，涉及自然语言处理技术领域，包括：将适配数据库的数据集输入到开源大模型，并对生成数据进行验证，对验证失败的错误数据进行收集；通过闭源大模型将所述错误数据进行修正，以得到修正数据；将所述错误数据和所述修正数据与查询需求相关联，以形成训练样本；采用直接偏好优化策略，利用所述训练样本，对所述开源大模型进行有监督微调。

技术关键词

模型训练方法自然语言数据库结构语句 SQL语法更新模型参数策略计算机程序产品处理器数据标签样本格式解析器数据存储可读存储介质关键字指令执行器

一种基于错误修正和偏好优化的NL2SQL大模型训练方法

站点导航

APP 下载