摘要
本申请公开了一种模型的迁移方法及相关设备,以解决现有技术中通过对深度学习模型进行量化处理以使GPU能有资源执行推理任务时,降低了模型的预测能力和准确性,导致在高准确率和精准率要求的应用场景中不适用的问题。该方法包括:确定图形处理单元中的算法模型被调用执行推理任务的调用频次;若调用频次小于预设调用频次阈值,则将调用频次小于预设调用频次阈值的空闲算法模型的层次结构信息和与推理任务相关的模型参数信息迁移至CPU和内存,以及使空闲算法模型的线程进入休眠状态;当接收到空闲算法模型的调用请求时,唤醒处于休眠状态的线程,并将空闲算法模型的层次结构信息和模型参数信息从CPU和内存中迁移至图形处理单元。
技术关键词
算法模型
层次结构信息
迁移方法
内存
图形处理单元资源
处理器
可读存储介质
深度学习模型
注册机
数据
计算机程序产品
模块
存储器
电子设备
场景
标识
系统为您推荐了相关专利信息
健康管理功能
主板
扩展网络接口
网络单元
扩展单元
气候控制装置
数据处理模块
空气质量指数
数据采集模块
云端服务器
分布式集群数据
时间预测模型
节点
资源评估模型
资源特征