基于大语言模型的查询语句生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202411008424

申请日期：2024-07-25

公开号：CN118964560A

公开日期：2024-11-15

类型：发明专利

摘要

本申请提供的一种基于大语言模型的查询语句生成方法、装置、设备及介质，大语言模型包括多个编码器，方法包括：获取查询文本；对查询文本进行向量化处理，以得到查询文本对应的目标向量表示；将目标向量表示输入至多个编码器，以通过各编码器的权重矩阵对目标向量表示进行编码处理，得到各编码器对应的上下文向量，其中，不同的编码器的权重矩阵不同；根据各编码器对应的上下文向量，生成目标查询语句，允许模型在不同的注意力头中专注不同的信息特征，独立地捕捉查询文本的不同方面，在多个抽象层次上处理信息，从而更好地捕捉复杂和抽象的语义关系，在处理复杂、模糊的提问时能够很好地区分信息的重要程度，提高了查询语句生成的准确性。

技术关键词

结构化查询语言编码器大语言模型查询意图注意力查询语句生成方法模板解码器计算机执行指令识别器文本矩阵模块预训练语言模型可读存储介质意图识别样本

基于大语言模型的查询语句生成方法、装置、设备及介质

站点导航

APP 下载