大语言模型微调及基于大语言模型的文本处理方法及设备

AITNT
正文
推荐专利
大语言模型微调及基于大语言模型的文本处理方法及设备
申请号:CN202411818936
申请日期:2024-12-10
公开号:CN119961281A
公开日期:2025-05-09
类型:发明专利
摘要
本申请涉及数据处理技术领域,尤其涉及大语言模型微调及基于大语言模型的文本处理方法及设备。在微调阶段,基于大语言模型增量微调技术,基于行业知识构建数据集,基于该数据集对大语言模型进行第一次微调,得到学习到了行业知识的中间大语言模型。基于用于学习text2sql能力的指令数据,对中间大语言模型进行text2sql任务增量微调,微调后的收敛模型即为最终微调得到的大语言模型,使得最终微调后的大语言模型能够基于行业知识进行文本处理。在推理阶段,电子设备召回与待处理文本相关的表数据和目标行业知识,并基于该表数据和目标行业知识构建prompt,能够更加准确的生成sql语句,提升text2sql的准确率。
技术关键词
大语言模型 文本处理方法 字段 微调方法 结构化查询语句 结构化查询语言 收敛模型 微调技术 电子设备 模板 数据处理技术 业务表 指令 存储器 处理器 算法 阶段
系统为您推荐了相关专利信息
1
一种页面搭建方法、装置及介质
页面搭建方法 协议 训练样本集 摘要 语义
2
一种基于大语言模型的异构数据库模式集成方法及系统
大语言模型 模式集成方法 计算机程序指令 异构 文档型数据库
3
一种基于声纹识别的智能油气诊断方法
设备故障诊断 故障传播路径 诊断方法 节点 油气设备
4
一种基于大模型微调的电信业务问答方法、系统和服务器
大语言模型 问答方法 分布式训练 处理器 文本
5
大语言模型的训练方法、装置、电子设备及存储介质
大语言模型 指令 样本 生成训练数据 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号