一种大模型训练方法、装置及设备

AITNT
正文
推荐专利
一种大模型训练方法、装置及设备
申请号:CN202410743580
申请日期:2024-06-07
公开号:CN118586284A
公开日期:2024-09-03
类型:发明专利
摘要
本说明书实施例中公开了一种大模型训练方法、装置及设备。该方案可以包括:模型提供方可以根据预训练大模型中各个预设网络层的重要程度信息,将重要程度较低的第一网络层变更为预设轻量级网络层,并允许调整重要程度较高的第二网络层的参数,从而得到预训练大模型的仿真模型。后续,在数据所有方利用业务数据对该仿真模型进行训练,并反馈其取得的针对第二网络层的调整后参数数据后,模型提供方即可结合所述第二网络层的调整后参数数据以及所述预训练大模型,生成目标大模型。
技术关键词
动作策略 仿真模型 适配器 参数 业务数据处理 模型训练方法 强化学习算法 模型训练设备 插件 模型训练装置 关系 样本 处理器通信 数据处理单元 存储器 数据处理模块 方针
系统为您推荐了相关专利信息
1
一种发电厂伴热设备故障点监测系统及方法
故障点监测 伴热设备 SMO算法 故障诊断模块 包络
2
盾构刀具磨损预测方法、装置、电子设备及产品
盾构刀具磨损 掘进参数 曲线 剩余使用寿命 刀盘
3
一种存储芯片老化测试方法、装置、设备及存储介质
存储芯片 老化测试方法 执行老化测试 模式 参数
4
基于人工智能与数据融合的睡眠监测控制交互系统及方法
控制交互系统 压力 传感器阵列 补偿值 数据获取模块
5
漂浮式风机基础结构的应力计算方法、装置、设备和介质
漂浮式风机基础 气动力 浮体 叶轮 应力计算方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号