一种基于侧网络的大模型微调训练方法、系统及装置

AITNT
正文
推荐专利
一种基于侧网络的大模型微调训练方法、系统及装置
申请号:CN202410728668
申请日期:2024-06-06
公开号:CN118313435B
公开日期:2024-08-16
类型:发明专利
摘要
本发明公开了一种基于侧网络的大模型微调训练方法、系统及装置,其中涉及的一种基于侧网络的大模型微调训练方法,包括:S1.获取模型使用方本地拥有的预训练参数和微调训练数据;S2.将获取的预训练参数进行模型压缩得到侧网络参数,并将得到的侧网络参数同步给外部算力;S3.基于微调训练数据对模型进行微调训练;其中在微调训练时固定预训练参数,对侧网络参数进行更新,外部算力将更新后的侧网络参数同步给本地;S4.训练结束后,本地得到最终更新后的侧网络参数。
技术关键词
网络 参数 训练装置 模型压缩 训练系统 数据 输入输出设备 模块 处理器 传输设备 外部设备 存储器 指令
系统为您推荐了相关专利信息
1
用于构建车辆目标检测模型的方法及装置、计算机可读存储介质
融合网络结构 车载场景 车辆 可读存储介质 视角
2
一种钨与硫酸化共改性铁基耐硫脱硝催化剂及其构建方法
三氧化二铁 催化剂 硫酸 改性 离子
3
大曲发酵的微生物丰度预测方法及装置、电子设备
丰度预测方法 大曲 时序神经网络 数据 阶段
4
一种基于进化计算的运输型纳米机器人仿真设计方法、装置及存储介质
纳米机器人 仿真设计方法 机器人结构 非牛顿流体 触觉传感器
5
日志告警数据的处理方法及装置、存储介质、电子设备
信息抽取模型 神经网络模型 告警关联分析 语义 系统日志
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号