摘要
本申请提供的一种基于大语言模型的查询语句生成方法、装置、设备及介质,大语言模型包括多个编码器,方法包括:获取查询文本;对查询文本进行向量化处理,以得到查询文本对应的目标向量表示;将目标向量表示输入至多个编码器,以通过各编码器的权重矩阵对目标向量表示进行编码处理,得到各编码器对应的上下文向量,其中,不同的编码器的权重矩阵不同;根据各编码器对应的上下文向量,生成目标查询语句,允许模型在不同的注意力头中专注不同的信息特征,独立地捕捉查询文本的不同方面,在多个抽象层次上处理信息,从而更好地捕捉复杂和抽象的语义关系,在处理复杂、模糊的提问时能够很好地区分信息的重要程度,提高了查询语句生成的准确性。
技术关键词
结构化查询语言
编码器
大语言模型
查询意图
注意力
查询语句生成方法
模板
解码器
计算机执行指令
识别器
文本
矩阵
模块
预训练语言模型
可读存储介质
意图识别
样本