摘要
本发明属于自然语言处理领域,尤其基于聚类的Text‑to‑SQL示例合成方法、设备以及存储介质。本发明目的是解决现有的方法依赖于人工标注的示例池导致大模型性能根据用户问题生成SQL语句准确率低的问题,采用基于人工标注,获取原示例池;采用聚类方法将步骤一获取的原示例池中的示例划分为N个子示例池;根据划分后的N个子示例池进行合成,得到合成示例池;所述合成示例池包括M个合成示例;将合成示例池加入原示例池中,得到融合示例池,增强示例池多样性,从而降低示例标注的开销,解决了依赖于人工标注的示例池导致大模型性能根据用户问题生成SQL语句准确率低的问题。
技术关键词
聚类方法
语句
计算机存储介质
编码器
自然语言
处理器
指令
存储器
算法