摘要
本申请公开了一种基于关键字的模型部署方法、装置、设备及存储介质,该方法包括:获取模型结构关键字和模型资源关键字;基于模型结构关键字,生成目标处理模型;目标处理模型包括多个模型组件;基于模型资源关键字,对目标处理模型中的多个模型组件进行资源配置。采用本申请的方法可以简化大模型服务的部署过程以及降低大模型部署过程中资源配置的难度。
技术关键词
关键字
模型部署方法
资源分配
集群
总量
关系
计算机设备
动态
处理器
可读存储介质
存储器
模块
系统为您推荐了相关专利信息
大数据
分布式数据存储
生态
分布式文件系统
多源异构数据
工控系统
数据库备份方法
机器学习模型训练
时间段
数据库备份系统
能源管理系统
能源管理策略
零碳
排放量
储能设备
时间预测模型
预约方法
行程
多任务学习模型
网约车
风险评估方法
联合分布函数
Copula函数
数值
上游围堰