大模型部署方法以及相关设备

AITNT
正文
推荐专利
大模型部署方法以及相关设备
申请号:CN202411536260
申请日期:2024-10-30
公开号:CN119512567A
公开日期:2025-02-25
类型:发明专利
摘要
本申请实施例公开了一种大模型部署方法以及相关设备,能够在提高大模型部署效率的情况下,进行大模型部署。本申请实施例方法包括:根据目标请求确定显存中是否部署有目标请求对应的满足预设条件的目标任务的当前大模型,若确定显存中未部署有目标请求对应的满足预设条件的目标任务的当前大模型,则将训练完成的目标任务的微调参数加载至显存,并将显存中部署的当前大模型的当前微调参数替换为显存中的目标任务的微调参数,以部署目标任务的大模型,若确定显存中部署有目标请求对应的满足预设条件的目标任务的当前大模型,则将当前大模型作为目标任务的大模型,以通过目标任务的大模型进行目标请求对应的目标任务的推理。
技术关键词
缓存系统 参数 模型部署方法 计算机程序产品 中央处理器 存储器 可读存储介质 基础 指令 关系 速度
系统为您推荐了相关专利信息
1
一种基于地质模型的防渗帷幕三维构建方法及系统
防渗帷幕 三维构建方法 帷幕灌浆 底线 中心线
2
保护数据隐私的多主体联合品种产量预测方法与系统
产量预测方法 保护数据隐私 森林模型 样本 客户端结构
3
一种多目标雷达探测电路
运算放大器 主控模块 电容 控制芯片 射频芯片
4
一种基于深度学习的石墨矿石图像模糊消除的方法
对抗网络模型 矿石 石墨 通道注意力机制 多尺度特征融合
5
脉冲激励下动车组转向架系统自振特性测试设备及方法
动车组转向架系统 信号采集设备 特性测试方法 特性测试设备 信号处理设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号