基于大模型的自然语言查询解析及数据库字段匹配方法

正文

推荐专利

申请号：CN202511009398

申请日期：2025-07-22

公开号：CN121009105A

公开日期：2025-11-25

类型：发明专利

摘要

本说明书实施例提供了一种基于大模型的自然语言查询解析及数据库字段匹配方法，包括：基于大语言模型LLM对用户自然语言查询进行意图解析与实体识别，提取潜在的关键词集合；对每个提取出的关键词，通过STAM机制绑定实体类型，并构建实体‑类型映射关系；构建列描述向量库，结合近似最近邻ANN算法实现高效检索，并通过多策略融合匹配机制将语义向量匹配、编辑距离匹配及溯源增强匹配的结果集合并，形成最终候选列集合；连接数据库元数据接口，解析信息并构建基础结构，生成增强语义的字段描述，以四元组结构组织输出；通过列匹配反推所属表，结合表内信息密度和与其他表的连接性进行表结构价值判定，剔除冗余表，优化数据库表示。

技术关键词

字段匹配方法自然语言语义向量多策略融合关键词实体大语言模型基础结构数据接口计算机可执行指令机制编辑距离算法过滤器模块冗余查询意图

基于大模型的自然语言查询解析及数据库字段匹配方法

站点导航

APP 下载