摘要
本发明提供一种用于辅助text2sql的自动化向量化模型构建方法,属于数据分析技术领域,具体包括:对用户查询数据进行同义词扩增得到扩增查询数据,基于预测组合确定与用户查询数据的对应的最优先的k个组合的相似度,根据相似度的排序结果进行可加入到初始训练集中的扩增查询数据的确定,利用可加入到初始训练集中的扩增查询数据对初始训练集进行改写得到训练集,并利用训练集对向量化模型进行重新训练得到改写训练模型,通过上述的训练过程对所述改写训练模型进行重复训练,直到改写后的改写训练模型在最新构建的测试集上的表现满足约束条件时,结束训练,保证了识别处理的准确性。
技术关键词
模型构建方法
同义词
训练集
样本
数据分析技术
日常用语
关键词
度函数
偏差
基础
字段
超参数
场景
代表
关系
系统为您推荐了相关专利信息
长短期记忆网络
序列
数据
训练预测模型
计算机设备
数据模型训练方法
样本
场景特征
广告点击率预测
通用特征
医学影像控制系统
模型训练方法
组织
判断标签
病历
随机森林
回归预测模型
皮尔逊相关系数
混凝剂投加量
变量