大模型训练方法、装置、电子设备、存储介质及产品

AITNT
正文
推荐专利
大模型训练方法、装置、电子设备、存储介质及产品
申请号:CN202411821263
申请日期:2024-12-11
公开号:CN119761452A
公开日期:2025-04-04
类型:发明专利
摘要
本公开提出了一种大模型训练方法、装置、电子设备、存储介质及产品。所述的方法包括:获取问题文本;对所述问题文本进行编码,得到与所述问题文本对应的第一向量;基于所述第一向量,确定控制网络的第二向量,所述第二向量为所述控制网络的控制条件;基于所述第一向量和所述控制网络的第二向量,确定与所述问题文本对应的输出结果。通过在原有的大模型的基础上,引入控制网络进行联合训练,既保持了原有模型的核心能力,减少训练数据较少的情况下的过拟合风险,又可以对特定任务以特定的控制条件强化模型对该任务的理解能力,解决了大模型在专业领域进行微调困难的问题。
技术关键词
文本 模型训练方法 网络 分类预测模型 预测误差 模型训练装置 电子设备 链路 编码 计算机程序产品 处理器通信 指令 可读存储介质 存储器 思路 专业 数据 核心
系统为您推荐了相关专利信息
1
道路边坡浅表位移监测方法、系统、装置、设备和介质
位移监测方法 训练样本数据 循环神经网络模型 位移监测系统 土体含水量
2
一种面向城市收缩的绿色空间网络优化方法及系统
网络优化方法 高分辨率遥感影像 节点 城市绿色空间 网格
3
机器人定位方法、装置、设备及存储介质
卫星定位数据 特征地图 机器人定位方法 线特征 机器人行进路径
4
路径规划方法、系统及运输控制器
路径规划方法 线路 终点 深度神经网络 区域控制单元
5
一种微网群自治方法、系统、设备及存储介质
有功功率 神经网络参数 深度神经网络 决策 变量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号