大模型部署方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
大模型部署方法、装置、设备、存储介质及程序产品
申请号:CN202511210953
申请日期:2025-08-27
公开号:CN120909607A
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供一种大模型部署方法、装置、设备、存储介质及程序产品,涉及大模型部署技术领域。该方法包括:云端服务器接收终端发送的当前运行场景信息和当前资源使用信息;确定当前运行场景信息和当前资源使用信息是否适配终端的当前大模型的规格;若否,则基于当前运行场景信息和当前资源使用信息,采用多目标约束与优化方法从模型库中筛选获得目标大模型,多目标约束与优化方法用于确定大模型筛选的约束条件和优化目标;向终端发送目标大模型的模型信息,以使终端根据模型信息部署目标大模型,并通过目标大模型进行推理。本发明能够实现大模型的按需动态调整,获得的目标大模型能够更好地适应复杂多变场景的需求。
技术关键词
模型部署方法 云端服务器 终端 场景 模型库 计算机执行指令 计算机程序指令 资源释放机制 切换方法 模块 可读存储介质 映射方法 计算机程序产品 处理器通信 存储器 内存 精度
系统为您推荐了相关专利信息
1
导航控制方法、电子设备、车辆及存储介质
行程 导航控制方法 地图应用程序 操作系统 终点
2
一种基于强化学习的场景图问答推理模型的构建方法
数据 答案 重构 视觉问答技术 实体
3
一种学校实验室危化废物智能收集装置
电控锁系统 感知系统 学校实验室 物联 嵌入式芯片
4
一种基于语义图的语言模型提示构造与智能体任务规划方法
语义场景 自然语言 层级 多模态传感器 规划
5
基于自适应强度估计与协同惩罚剪枝的空间多目标跟踪方法
跟踪方法 强度 标记 权重分配策略 运动特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号