模型的训练方法、装置、电子设备、存储介质和计算机程序产品

正文

推荐专利

申请号：CN202410947007

申请日期：2024-07-15

公开号：CN118916693A

公开日期：2024-11-08

类型：发明专利

摘要

本公开关于模型的训练方法、装置、电子设备、存储介质和计算机程序产品，该方法包括：将训练演示和训练指令输入超网络编码器内；将编码结果输入适配器生成器内；基于适配器权重调整学生模型；将训练输入和编码结果输入调整后的学生模型；将训练数据输入教师模型，获得教师输出分布；计算训练损失；基于训练损失对超网络和学生模型进行训练。这样，可以基于训练演示和训练指令利用适配器生成器获得适配器权重，即可以自动从训练指令中生成特定任务的适配器，而无需对未见任务进行重新训练，降低了对大量标记数据的依赖，可以提高模型的跨任务泛化能力。并且，还可以实现降低计算开销、节省计算成本，提高了模型在实际应用中的适应性和灵活性。

技术关键词

学生教师适配器超网络大语言模型编码器指令计算机程序产品标签电子设备解码器处理器可读存储介质数据获取模块训练装置编码模块

系统为您推荐了相关专利信息

基于控制流分析与检索增强的大模型代码安全审查方法

大语言模型语法特征融合多源信息持续集成工具版本控制系统

一种基于检索增强生成的文本指向性图像分割方法及系统

图像分割方法多模态文本实体互联网

行业大模型的生成方法、装置、电子设备及存储介质

参数数据生成方法矩阵解码信息

基于智能体的语句转化方法、装置、电子设备及存储介质

语义向量语句大语言模型转化方法数据

电网基层作业问题回复生成方法、装置、设备和存储介质

分词词语文本回复生成方法分块策略

模型的训练方法、装置、电子设备、存储介质和计算机程序产品

站点导航

APP 下载