模型的迁移方法及相关设备

AITNT
正文
推荐专利
模型的迁移方法及相关设备
申请号:CN202411580759
申请日期:2024-11-06
公开号:CN119127448B
公开日期:2025-02-18
类型:发明专利
摘要
本申请公开了一种模型的迁移方法及相关设备,以解决现有技术中通过对深度学习模型进行量化处理以使GPU能有资源执行推理任务时,降低了模型的预测能力和准确性,导致在高准确率和精准率要求的应用场景中不适用的问题。该方法包括:确定图形处理单元中的算法模型被调用执行推理任务的调用频次;若调用频次小于预设调用频次阈值,则将调用频次小于预设调用频次阈值的空闲算法模型的层次结构信息和与推理任务相关的模型参数信息迁移至CPU和内存,以及使空闲算法模型的线程进入休眠状态;当接收到空闲算法模型的调用请求时,唤醒处于休眠状态的线程,并将空闲算法模型的层次结构信息和模型参数信息从CPU和内存中迁移至图形处理单元。
技术关键词
算法模型 层次结构信息 迁移方法 内存 图形处理单元资源 处理器 可读存储介质 深度学习模型 注册机 数据 计算机程序产品 模块 存储器 电子设备 场景 标识
系统为您推荐了相关专利信息
1
一种全国产化计算主板及服务器
健康管理功能 主板 扩展网络接口 网络单元 扩展单元
2
智能AI家庭气候控制装置
气候控制装置 数据处理模块 空气质量指数 数据采集模块 云端服务器
3
基于高速互通连接的语言模型检索推理系统、方法
内存 交换机 图像处理器 推理系统 分区模块
4
分布式集群数据生产系统
分布式集群数据 时间预测模型 节点 资源评估模型 资源特征
5
一种游戏广告媒体包的上报检查方法、系统、设备及介质
广告媒体 脚本 检查方法 内存泄漏检测 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号