摘要
本公开提供了模型融合方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、云计算、大模型等技术领域。具体实现方案为:在大模型的预训练过程中,调用主进程将预训练过程中的中间模型参数缓存至主缓存器中;通过主进程调用子进程读取主缓存器中的中间模型参数以及根据中间模型参数进行参数融合处理;其中,主进程和子进程可以异步进行,在大模型的预训练的同时可以对大模型预训练得到的中间模型参数进行参数融合处理,从而在不影响大模型的预训练效率的情况下,提高了模型融合效率。
技术关键词
参数
模型融合方法
模型预训练
进程间通信机制
周期
电子设备
图形处理器
融合装置
人工智能技术
计算机程序产品
中央处理器
处理器通信
指令
内存
可读存储介质
存储器
硬盘
系统为您推荐了相关专利信息
库存周转率
数字孪生模型
数字孪生系统
货架
大数据处理平台
负载特性曲线
协同调度方法
工业机器人
智能工厂
周期
状态智能诊断
抗干扰通信模块
能源管理模块
SF6气体浓度
动态基线模型