大模型的部署方法、装置、设备、介质和产品

AITNT
正文
推荐专利
大模型的部署方法、装置、设备、介质和产品
申请号:CN202510281465
申请日期:2025-03-11
公开号:CN120218137A
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种大模型的部署方法、装置、设备、介质和产品,涉及人工智能技术领域,包括:响应于用户对云端服务器中初始大模型的结构配置操作,生成待量化大模型;其中,待量化大模型与本地终端中的待部署大模型具有相同的模型结构;采用至少一种大模型量化方法分别对待量化大模型进行模型量化,生成至少一组候选模型量化参数,并从候选模型量化参数中确定目标模型量化参数;将目标模型量化参数发送至本地终端,使得本地终端根据目标模型量化参数对待部署大模型进行模型部署。本发明利用云端服务器进行模型量化,使得模型量化流程不受本地终端硬件上的限制,提升模型量化的效率及精度,进一步提升待部署大模型的推理性能与效率。
技术关键词
云端服务器 参数 模型转换方法 动态指纹 识别终端 标识 关系 可读存储介质 人工智能技术 精度 逻辑 计算机程序产品 编程 资源 电子设备 处理器通信
系统为您推荐了相关专利信息
1
辅助信号调理的谐振压力传感器检测系统及方法
谐振压力传感器 信号调理电路 信号调理模块 设备基础 参数
2
一种基于散度最小化的自适应多伯努利多目标跟踪方法
协方差矩阵 跟踪方法 量测噪声 变分贝叶斯方法 参数
3
煤矿冲击地压危险区域识别方法
监测点 结构网络模型 冲击地压危险区域 动态时间规整算法 密度聚类算法
4
一种带驱动电路的有机发光显示噪声消除方法
显示噪声消除 噪声消除方法 噪声识别 噪声特征 噪声数据
5
一种激光诱导石英材料破坏阈值预测方法及相关装置
阈值预测方法 激光 石英 物理 生成神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号