大语言模型微调及基于大语言模型的文本处理方法及设备

正文

推荐专利

申请号：CN202411818936

申请日期：2024-12-10

公开号：CN119961281A

公开日期：2025-05-09

类型：发明专利

摘要

本申请涉及数据处理技术领域，尤其涉及大语言模型微调及基于大语言模型的文本处理方法及设备。在微调阶段，基于大语言模型增量微调技术，基于行业知识构建数据集，基于该数据集对大语言模型进行第一次微调，得到学习到了行业知识的中间大语言模型。基于用于学习text2sql能力的指令数据，对中间大语言模型进行text2sql任务增量微调，微调后的收敛模型即为最终微调得到的大语言模型，使得最终微调后的大语言模型能够基于行业知识进行文本处理。在推理阶段，电子设备召回与待处理文本相关的表数据和目标行业知识，并基于该表数据和目标行业知识构建prompt，能够更加准确的生成sql语句，提升text2sql的准确率。

技术关键词

大语言模型文本处理方法字段微调方法结构化查询语句结构化查询语言收敛模型微调技术电子设备模板数据处理技术业务表指令存储器处理器算法阶段

系统为您推荐了相关专利信息

一种页面搭建方法、装置及介质

页面搭建方法协议训练样本集摘要语义

一种基于大语言模型的异构数据库模式集成方法及系统

大语言模型模式集成方法计算机程序指令异构文档型数据库

一种基于声纹识别的智能油气诊断方法

设备故障诊断故障传播路径诊断方法节点油气设备

一种基于大模型微调的电信业务问答方法、系统和服务器

大语言模型问答方法分布式训练处理器文本

大语言模型的训练方法、装置、电子设备及存储介质

大语言模型指令样本生成训练数据标签

大语言模型微调及基于大语言模型的文本处理方法及设备

站点导航

APP 下载