摘要
本申请实施例公开了一种大模型部署方法以及相关设备,能够在提高大模型部署效率的情况下,进行大模型部署。本申请实施例方法包括:根据目标请求确定显存中是否部署有目标请求对应的满足预设条件的目标任务的当前大模型,若确定显存中未部署有目标请求对应的满足预设条件的目标任务的当前大模型,则将训练完成的目标任务的微调参数加载至显存,并将显存中部署的当前大模型的当前微调参数替换为显存中的目标任务的微调参数,以部署目标任务的大模型,若确定显存中部署有目标请求对应的满足预设条件的目标任务的当前大模型,则将当前大模型作为目标任务的大模型,以通过目标任务的大模型进行目标请求对应的目标任务的推理。
技术关键词
缓存系统
参数
模型部署方法
计算机程序产品
中央处理器
存储器
可读存储介质
基础
指令
关系
速度
系统为您推荐了相关专利信息
产量预测方法
保护数据隐私
森林模型
样本
客户端结构
对抗网络模型
矿石
石墨
通道注意力机制
多尺度特征融合
动车组转向架系统
信号采集设备
特性测试方法
特性测试设备
信号处理设备