一种基于NL2SQL的大语言模型构建方法以及装置

AITNT
正文
推荐专利
一种基于NL2SQL的大语言模型构建方法以及装置
申请号:CN202510546407
申请日期:2025-04-28
公开号:CN120448410A
公开日期:2025-08-08
类型:发明专利
摘要
本发明提供的基于NL2SQL的大语言模型构建方法以及装置,包括:获取原始数据集,对原始数据集进行预处理,以得到预处理后的原始数据集,确定预处理后的原始数据集中段落之间的逻辑关系,将逻辑关系相同的段落进行合并,以得到合并之后的数据集,提取合并之后的数据集中的关键信息,基于关键信息,构建训练数据集,其中,训练数据集包括多个问题以及每个问题对应的SQL语句,基于训练数据集,对大语言模型进行训练,以得到训练后的大语言模型。通过分析原始数据集中段落之间的逻辑关系,精简段落并提高提取短路中关键信息的效率。基于关键信息构建训练数据集,有效提升NL2SQL的准确性,降低数据集构建的难度,增强系统的实用性。
技术关键词
语言模型构建方法 数据 语句 文本 模型构建装置 字段 语义 索引 大语言模型 关系 模块 模板 动态 短路
系统为您推荐了相关专利信息
1
一种基于时空一致性约束的医学图像分割方法及相关装置
图像分割模型 医学影像数据 像素 医学图像分割方法 条件随机场
2
多尺度递进式短期洪涝智能预警方法、装置、设备及介质
智能预警方法 智能模型 空间地理数据 构建高分辨率 数值
3
一种基于多源数据融合与集成算法驱动的城市道路CO2浓度逐时模拟预测方法
模拟预测方法 集成算法 城市道路 长短期记忆网络 随机森林模型
4
一种基于智能体的配电系统健康监测与预测方法
配电系统 历史运行状态 智能调度算法 策略 多层次特征
5
基于地理信息的建筑物室内智能标识管理系统
标识管理系统 地磁 建筑物 坐标 特征数据库
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号