一种用于辅助text2sql的自动化向量化模型构建方法

正文

推荐专利

申请号：CN202410973295

申请日期：2024-07-19

公开号：CN118861083A

公开日期：2024-10-29

类型：发明专利

摘要

本发明提供一种用于辅助text2sql的自动化向量化模型构建方法，属于数据分析技术领域，具体包括：对用户查询数据进行同义词扩增得到扩增查询数据，基于预测组合确定与用户查询数据的对应的最优先的k个组合的相似度，根据相似度的排序结果进行可加入到初始训练集中的扩增查询数据的确定，利用可加入到初始训练集中的扩增查询数据对初始训练集进行改写得到训练集，并利用训练集对向量化模型进行重新训练得到改写训练模型，通过上述的训练过程对所述改写训练模型进行重复训练，直到改写后的改写训练模型在最新构建的测试集上的表现满足约束条件时，结束训练，保证了识别处理的准确性。

技术关键词

模型构建方法同义词训练集样本数据分析技术日常用语关键词度函数偏差基础字段超参数场景代表关系

系统为您推荐了相关专利信息

缓存空间的容量调整方法及计算机设备

长短期记忆网络序列数据训练预测模型计算机设备

基于多域数据模型训练方法和装置、电子设备和存储介质

数据模型训练方法样本场景特征广告点击率预测通用特征

PET/MRI影像的数据治理模型训练方法、装置及数据治理方法

医学影像控制系统模型训练方法组织判断标签病历

基于贝叶斯更新和自适应元学习采样方法的结构系统识别方法

采样方法结构系统采样器更新方法样本

一种基于随机森林回归的混凝加药量预测方法

随机森林回归预测模型皮尔逊相关系数混凝剂投加量变量

一种用于辅助text2sql的自动化向量化模型构建方法

站点导航

APP 下载