摘要
本发明提供一种大模型部署方法、装置、设备、存储介质及程序产品,涉及大模型部署技术领域。该方法包括:云端服务器接收终端发送的当前运行场景信息和当前资源使用信息;确定当前运行场景信息和当前资源使用信息是否适配终端的当前大模型的规格;若否,则基于当前运行场景信息和当前资源使用信息,采用多目标约束与优化方法从模型库中筛选获得目标大模型,多目标约束与优化方法用于确定大模型筛选的约束条件和优化目标;向终端发送目标大模型的模型信息,以使终端根据模型信息部署目标大模型,并通过目标大模型进行推理。本发明能够实现大模型的按需动态调整,获得的目标大模型能够更好地适应复杂多变场景的需求。
技术关键词
模型部署方法
云端服务器
终端
场景
模型库
计算机执行指令
计算机程序指令
资源释放机制
切换方法
模块
可读存储介质
映射方法
计算机程序产品
处理器通信
存储器
内存
精度
系统为您推荐了相关专利信息
电控锁系统
感知系统
学校实验室
物联
嵌入式芯片