摘要
本申请公开了一种三阶段训练NL2SQL模型的方法,其包括:对原始数据进行预处理得到训练数据集,初始化模型;所述原始数据包括数据库表名、创建数据库的sql语句、用户问题、标准SQL语句、检索内容;冷启动阶段,加载Base模型、Lora_init模型和训练数据集,训练完成,得到Lora_Ice模型;Lora_Ice模型作为GRPO阶段的初始Lora模型;GRPO阶段,加载Base模型、Lora_Ice模型和训练数据集,训练完成,得到Lora_GRPO模型,在训练过程中收集反馈数据;反馈阶段,加载Base模型、Lora_init模型和反馈数据集,训练完成,得到Lora_Feedback模型。本申请提升了自然语言到SQL语句的转换准确性与执行效率,能够根据用户输入的问题,快速输出正确的答案。
技术关键词
阶段
语句
矩阵
监督学习方法
策略
一致性检测
超参数
缩放参数
自然语言
数据格式
模块
周期
答案
系统为您推荐了相关专利信息
单目深度估计
轻量级卷积神经网络
深度图
编码器架构
虚拟对象
分布式共识
动态访问控制策略
管理方法
风险
分布式存储结构
智能调控方法
多智能体深度强化学习
热力耦合模型
围护结构
建筑