摘要
本申请公开了一种模型训练方法、数据处理方法、设备及程序产品,涉及计算机技术领域,该方法包括:通过将训练框架和推理框架分离部署在不同节点,并通过配置通信域实现训练框架与推理框架之间的通信,所述训练框架根据训练数据执行训练,在训练过程中通过所述通信域将所述训练框架的模型权重参数发送给所述推理框架;所述推理框架根据所述模型权重参数进行更新,在更新后执行推理验证,并将推理结果发送给所述训练框架;基于所述训练框架和所述推理框架的最终输出,得到训练后模型,实现了训练和推理的并行计算,加速模型训练推理的数据处理速度,缓解训练及推理阶段算力短缺的问题,能够在有限的训练时长内保证模型的性能。
技术关键词
模型训练方法
框架
加速卡
通信域
数据处理方法
参数
加速模型训练
异构设备
异步方式
预训练模型
远程访问
计算机程序产品
节点
处理器
电子设备
存储器
阶段
关系
系统为您推荐了相关专利信息
节点特征
节点分类方法
集成学习框架
集成学习算法
标签
样本
对象
内容推荐请求
内容推荐系统
模型训练方法
数据评估方法
计算机可读指令
分类模型构建
风险
数据评估装置