模型的迁移方法及相关设备

正文

推荐专利

模型的迁移方法及相关设备

申请号：CN202411580759

申请日期：2024-11-06

公开号：CN119127448B

公开日期：2025-02-18

类型：发明专利

摘要

本申请公开了一种模型的迁移方法及相关设备，以解决现有技术中通过对深度学习模型进行量化处理以使GPU能有资源执行推理任务时，降低了模型的预测能力和准确性，导致在高准确率和精准率要求的应用场景中不适用的问题。该方法包括：确定图形处理单元中的算法模型被调用执行推理任务的调用频次；若调用频次小于预设调用频次阈值，则将调用频次小于预设调用频次阈值的空闲算法模型的层次结构信息和与推理任务相关的模型参数信息迁移至CPU和内存，以及使空闲算法模型的线程进入休眠状态；当接收到空闲算法模型的调用请求时，唤醒处于休眠状态的线程，并将空闲算法模型的层次结构信息和模型参数信息从CPU和内存中迁移至图形处理单元。

技术关键词

算法模型层次结构信息迁移方法内存图形处理单元资源处理器可读存储介质深度学习模型注册机数据计算机程序产品模块存储器电子设备场景标识

系统为您推荐了相关专利信息

一种全国产化计算主板及服务器

健康管理功能主板扩展网络接口网络单元扩展单元

智能AI家庭气候控制装置

气候控制装置数据处理模块空气质量指数数据采集模块云端服务器

基于高速互通连接的语言模型检索推理系统、方法

内存交换机图像处理器推理系统分区模块

分布式集群数据生产系统

分布式集群数据时间预测模型节点资源评估模型资源特征

一种游戏广告媒体包的上报检查方法、系统、设备及介质

广告媒体脚本检查方法内存泄漏检测数据

模型的迁移方法及相关设备

站点导航

APP 下载