摘要
本说明书实施例提供了一种基于大模型的自然语言查询解析及数据库字段匹配方法,包括:基于大语言模型LLM对用户自然语言查询进行意图解析与实体识别,提取潜在的关键词集合;对每个提取出的关键词,通过STAM机制绑定实体类型,并构建实体‑类型映射关系;构建列描述向量库,结合近似最近邻ANN算法实现高效检索,并通过多策略融合匹配机制将语义向量匹配、编辑距离匹配及溯源增强匹配的结果集合并,形成最终候选列集合;连接数据库元数据接口,解析信息并构建基础结构,生成增强语义的字段描述,以四元组结构组织输出;通过列匹配反推所属表,结合表内信息密度和与其他表的连接性进行表结构价值判定,剔除冗余表,优化数据库表示。
技术关键词
字段匹配方法
自然语言
语义向量
多策略融合
关键词
实体
大语言模型
基础结构
数据接口
计算机可执行指令
机制
编辑距离算法
过滤器模块
冗余
查询意图