文本处理模型的训练方法、文本处理方法、问答处理方法及装置

正文

推荐专利

申请号：CN202410711037

申请日期：2024-06-03

公开号：CN118627543A

公开日期：2024-09-10

类型：发明专利

摘要

本申请实施例公开了一种文本处理模型的训练方法、文本处理方法、问答处理方法及装置，涉及人工智能技术领域。方法包括：获取多个训练样本，训练样本至少包括文本样本；利用多个训练样本，将大语言模型作为教师模型进行蒸馏，得到作为学生模型的文本处理模型，文本处理模型的参数规模小于所述大语言模型；其中在蒸馏的过程中，利用大语言模型针对文本样本预测的POT(思维程序)信息和COT(思维链)信息指导文本处理模型的训练。本申请通过利用大语言模型预测的POT信息和COT信息共同指导文本处理模型的训练，提高了模型训练的准确率。

技术关键词

文本处理模型大语言模型文本处理方法样本蒸馏教师文本处理装置训练装置知识图谱构建学生存储程序指令处理器人工智能技术计算机程序产品云端服务器规模参数可读存储介质

系统为您推荐了相关专利信息

一种基于物理模型的多年冻土水热状态模拟方法及系统

多年冻土水热随机森林模型模拟系统气象

融合对抗增强与因果感知机制的电力需求预测方法及系统

电力需求预测方法变量移动通讯基站设备多头注意力机制加权特征

一种碳水利用率时空变化主导因素识别方法及系统

XGBoost模型空间分布特征识别方法总初级生产力净初级生产力

一种基于CTGAN的隧道病害监测数据增强方法及系统

隧道病害时间序列特征病害特征表格数据

一种避雷器的参数采样方法、装置及电子设备

泄漏电流值避雷器参数信息熵采样点样本

文本处理模型的训练方法、文本处理方法、问答处理方法及装置

站点导航

APP 下载