一种基于预训练模型的联合多任务表格语义解析方法

正文

推荐专利

申请号：CN202510085101

申请日期：2025-01-20

公开号：CN120011390A

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于预训练模型的联合多任务表格语义解析方法，涉及自然语言处理与数据库技术领域。该方法从指定网站爬取SQL语句，利用大语言模型将SQL及表格转为自然语言文本，提取列与表形成正、负样本，将实验数据转为Spider数据集格式，通过提示词模板和少样本框架完成自然语言问题及数据库模式任务；接着构建12层关系感知Transformer架构的MLNaT模型，输入按特定格式拼接的语句与列名，设置掩码语言、列预测和SQL生成三项任务，并进行预训练；最后在Spider数据集上以精确集合匹配率评估，以RAT‑SQL为基线模型。验证了MLNaT模型在列预测和SQL生成方面均优于基准模型。

技术关键词

语义解析方法预训练模型多任务大语言模型表格自然语言文本语句样本生成自然语言数据格式超参数数据库技术关键字解码器模板模式基线

系统为您推荐了相关专利信息

医学问题生成方法及装置

医学知识图谱实体大语言模型模式生成方法

基于学术文献层级标题的指令自动化构建方法和装置

层级大语言模型自动化构建方法指令数据获取单元

基于大模型的智能学习伴侣玩具交互方法、智能玩具

玩具交互方法大语言模型文本伴侣策略

一种基于大模型推理的企业技术演进趋势识别方法及系统

大语言模型多层结构技术子模块识别方法企业知识图谱

一种基于供需细粒度精准认知的个性化产品定制服务方法

产品定制服务产品个性化定制行业白皮书空调图谱

一种基于预训练模型的联合多任务表格语义解析方法

站点导航

APP 下载