摘要
本发明公开了一种大模型的部署方法、装置、设备、介质和产品,涉及人工智能技术领域,包括:响应于用户对云端服务器中初始大模型的结构配置操作,生成待量化大模型;其中,待量化大模型与本地终端中的待部署大模型具有相同的模型结构;采用至少一种大模型量化方法分别对待量化大模型进行模型量化,生成至少一组候选模型量化参数,并从候选模型量化参数中确定目标模型量化参数;将目标模型量化参数发送至本地终端,使得本地终端根据目标模型量化参数对待部署大模型进行模型部署。本发明利用云端服务器进行模型量化,使得模型量化流程不受本地终端硬件上的限制,提升模型量化的效率及精度,进一步提升待部署大模型的推理性能与效率。
技术关键词
云端服务器
参数
模型转换方法
动态指纹
识别终端
标识
关系
可读存储介质
人工智能技术
精度
逻辑
计算机程序产品
编程
资源
电子设备
处理器通信
系统为您推荐了相关专利信息
谐振压力传感器
信号调理电路
信号调理模块
设备基础
参数
协方差矩阵
跟踪方法
量测噪声
变分贝叶斯方法
参数
监测点
结构网络模型
冲击地压危险区域
动态时间规整算法
密度聚类算法
显示噪声消除
噪声消除方法
噪声识别
噪声特征
噪声数据