模型部署方法、装置、可读介质、电子设备及程序产品

正文

推荐专利

申请号：CN202411061272

申请日期：2024-08-02

公开号：CN118838605A

公开日期：2024-10-25

类型：发明专利

摘要

本公开涉及一种模型部署方法、装置、可读介质、电子设备及程序产品，方法包括：确定机器学习模型的参数信息以及用于部署机器学习模型的服务器的显卡显存；根据参数信息，确定机器学习模型在推理计算过程中所需要的目标显存；根据显卡显存和目标显存，确定机器学习模型在服务器中能够处理的最大请求数；根据最大请求数将机器学习模型部署在服务器中。由此，可以快速得到机器学习模型在服务器中能够处理的最大请求数，从而基于该最大请求数进行模型部署，提高模型部署效率。另外，由于最大请求数根据显卡显存确定，由此可以在服务器的显存允许范围内尽可能多的提高机器学习模型的吞吐量，使得机器学习模型可以更快地处理请求，减少用户等待时间。

技术关键词

机器学习模型模型部署方法服务器显卡注意力机制键值元素参数存储装置钩子电子设备计算机程序产品编码器介质尺寸模块数据精度

系统为您推荐了相关专利信息

一种面向民航机载监控的一体化智能物联感知方法及装置

感知装置物联数据采集单元数据处理单元机载服务器

一种基于神经网络模型的智能合约安全审计方法及系统

审计方法神经网络模型智能合约交易智能合约代码多层感知机

一种基于知识增强的自动驾驶场景可控生成方法

场景上下文生成方法对抗性表达式交通

考虑交通环境动态跟车场景下的车速预测方法及系统

车速预测方法融合特征深度学习模型交通特征选择方法

一种耦合垂直风廓线的机器学习风速订正方法及装置

订正方法风速机器学习模型训练数据滑动窗口技术

模型部署方法、装置、可读介质、电子设备及程序产品

站点导航

APP 下载