基于聚类的Text-to-SQL示例合成方法、设备以及存储介质

AITNT
正文
推荐专利
基于聚类的Text-to-SQL示例合成方法、设备以及存储介质
申请号:CN202411492400
申请日期:2024-10-24
公开号:CN119377711A
公开日期:2025-01-28
类型:发明专利
摘要
本发明属于自然语言处理领域,尤其基于聚类的Text‑to‑SQL示例合成方法、设备以及存储介质。本发明目的是解决现有的方法依赖于人工标注的示例池导致大模型性能根据用户问题生成SQL语句准确率低的问题,采用基于人工标注,获取原示例池;采用聚类方法将步骤一获取的原示例池中的示例划分为N个子示例池;根据划分后的N个子示例池进行合成,得到合成示例池;所述合成示例池包括M个合成示例;将合成示例池加入原示例池中,得到融合示例池,增强示例池多样性,从而降低示例标注的开销,解决了依赖于人工标注的示例池导致大模型性能根据用户问题生成SQL语句准确率低的问题。
技术关键词
聚类方法 语句 计算机存储介质 编码器 自然语言 处理器 指令 存储器 算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号