摘要
本申请涉及数据处理技术领域,尤其涉及大语言模型微调及基于大语言模型的文本处理方法及设备。在微调阶段,基于大语言模型增量微调技术,基于行业知识构建数据集,基于该数据集对大语言模型进行第一次微调,得到学习到了行业知识的中间大语言模型。基于用于学习text2sql能力的指令数据,对中间大语言模型进行text2sql任务增量微调,微调后的收敛模型即为最终微调得到的大语言模型,使得最终微调后的大语言模型能够基于行业知识进行文本处理。在推理阶段,电子设备召回与待处理文本相关的表数据和目标行业知识,并基于该表数据和目标行业知识构建prompt,能够更加准确的生成sql语句,提升text2sql的准确率。
技术关键词
大语言模型
文本处理方法
字段
微调方法
结构化查询语句
结构化查询语言
收敛模型
微调技术
电子设备
模板
数据处理技术
业务表
指令
存储器
处理器
算法
阶段
系统为您推荐了相关专利信息
大语言模型
模式集成方法
计算机程序指令
异构
文档型数据库
设备故障诊断
故障传播路径
诊断方法
节点
油气设备