摘要
本申请提供了一种基于生成式模型构建语言转换助手的方法和系统、电子设备及存储介质,涉及企业级数仓技术领域。该方法首先对各张初始数据表的元信息进行预处理,确保后续生成式模型能够准确理解数据表的结构和语义,提高生成的训练样本集的质量;随后利用生成式模型,结合至少一张预处理后数据表的元信息和当前日期,生成包含表信息、当前日期、自然语言查询问题、与自然语言查询问题对应的结构化语言检索语句的训练样本集,能够高效和准确地构建训练样本集;之后使用训练样本集对待训练模型进行训练,构建语言转换助手,后续语言转换助手可以帮助用户将自然语言查询问题转换为有效的结构化语言检索语句,提高了检索效率和准确性。
技术关键词
自然语言
训练样本集
日期
语句
字段
仓技术
电子设备
存储器
处理器
指标
语义
格式
企业
数据