大模型的部署方法、装置、设备、介质和产品

正文

推荐专利

申请号：CN202510281465

申请日期：2025-03-11

公开号：CN120218137A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种大模型的部署方法、装置、设备、介质和产品，涉及人工智能技术领域，包括：响应于用户对云端服务器中初始大模型的结构配置操作，生成待量化大模型；其中，待量化大模型与本地终端中的待部署大模型具有相同的模型结构；采用至少一种大模型量化方法分别对待量化大模型进行模型量化，生成至少一组候选模型量化参数，并从候选模型量化参数中确定目标模型量化参数；将目标模型量化参数发送至本地终端，使得本地终端根据目标模型量化参数对待部署大模型进行模型部署。本发明利用云端服务器进行模型量化，使得模型量化流程不受本地终端硬件上的限制，提升模型量化的效率及精度，进一步提升待部署大模型的推理性能与效率。

技术关键词

云端服务器参数模型转换方法动态指纹识别终端标识关系可读存储介质人工智能技术精度逻辑计算机程序产品编程资源电子设备处理器通信

系统为您推荐了相关专利信息

辅助信号调理的谐振压力传感器检测系统及方法

谐振压力传感器信号调理电路信号调理模块设备基础参数

一种基于散度最小化的自适应多伯努利多目标跟踪方法

协方差矩阵跟踪方法量测噪声变分贝叶斯方法参数

煤矿冲击地压危险区域识别方法

监测点结构网络模型冲击地压危险区域动态时间规整算法密度聚类算法

一种带驱动电路的有机发光显示噪声消除方法

显示噪声消除噪声消除方法噪声识别噪声特征噪声数据

一种激光诱导石英材料破坏阈值预测方法及相关装置

阈值预测方法激光石英物理生成神经网络模型

大模型的部署方法、装置、设备、介质和产品

站点导航

APP 下载