模型资源部署方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
模型资源部署方法、装置、设备、存储介质及程序产品
申请号:CN202411457993
申请日期:2024-10-18
公开号:CN119440812A
公开日期:2025-02-14
类型:发明专利
摘要
本申请公开了一种模型资源部署方法、装置、设备、存储介质及程序产品,涉及通信技术领域,以有效利用GPU资源。该方法包括:获取推理业务需求;根据所述推理业务需求,预估待部署的大模型所需的GPU资源;部署所需的GPU资源;在接收到推理任务的情况下,根据所述推理任务对部署的GPU资源进行调整。本申请实施例可以有效利用GPU资源。
技术关键词
资源部署方法 业务时延需求 GPU显卡 图形处理单元 令牌 处理器 收发器 计算机程序产品 组网方式 存储器 集群 通信设备 可读存储介质 批量 规模 模块 消息
系统为您推荐了相关专利信息
1
一种多模式身份验证方法、电子设备及存储介质
身份验证信息 多模式 身份验证方法 套件 动态口令验证
2
基于多模态数据的新生儿眼底图像分类方法及成像方法
眼底图像分类方法 图像编码器 多模态 图像分类模型 信息熵
3
一种图数据库文档站点用户鉴权和钉钉通知的实现方法
身份认证服务 站点 注册事件 代理服务器 执行鉴权
4
一种基于SysML模型的软件建模方法
SysML模型 软件建模方法 时间自动机模型 形式化验证技术 软件工程技术
5
基于多算法融合的新能源充电站与用户双主体精细化匹配控制方法及系统
新能源充电站 匹配控制方法 多算法融合 逻辑 模拟退火算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号