摘要
本公开提出了一种大模型训练方法、装置、电子设备、存储介质及产品。所述的方法包括:获取问题文本;对所述问题文本进行编码,得到与所述问题文本对应的第一向量;基于所述第一向量,确定控制网络的第二向量,所述第二向量为所述控制网络的控制条件;基于所述第一向量和所述控制网络的第二向量,确定与所述问题文本对应的输出结果。通过在原有的大模型的基础上,引入控制网络进行联合训练,既保持了原有模型的核心能力,减少训练数据较少的情况下的过拟合风险,又可以对特定任务以特定的控制条件强化模型对该任务的理解能力,解决了大模型在专业领域进行微调困难的问题。
技术关键词
文本
模型训练方法
网络
分类预测模型
预测误差
模型训练装置
电子设备
链路
编码
计算机程序产品
处理器通信
指令
可读存储介质
存储器
思路
专业
数据
核心
系统为您推荐了相关专利信息
位移监测方法
训练样本数据
循环神经网络模型
位移监测系统
土体含水量
网络优化方法
高分辨率遥感影像
节点
城市绿色空间
网格
卫星定位数据
特征地图
机器人定位方法
线特征
机器人行进路径
路径规划方法
线路
终点
深度神经网络
区域控制单元