模型量化方法、装置、设备、介质及计算机程序产品

AITNT
正文
推荐专利
模型量化方法、装置、设备、介质及计算机程序产品
申请号:CN202510004236
申请日期:2025-01-02
公开号:CN119990221A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供一种模型量化方法、装置、设备、介质及计算机程序产品,所述方法包括:基于获取的待处理模型的权重信息,确定权重矩阵;基于所述权重矩阵,确定所述待处理模型的权重块数据和代码本数据;基于所述权重块数据和所述代码本数据,对所述权重块进行迭代量化,得到量化模型;对所述待处理模型和所述量化模型进行困惑度对比,得到模型量化结果。本发明提供的模型量化方法可以减少大语言模型的存储空间和需求计算资源,提高模型的推理速度和效率,从而在资源受限的环境下,实现模型的高效部署和推理。
技术关键词
矩阵 量化误差 计算机程序产品 数据 文本 表达式 处理器 大语言模型 块尺寸 模块 存储器 因子 电子设备 词语 介质 索引 受限 元素
系统为您推荐了相关专利信息
1
一种面向室外场景的高效多视图立体重建方法及系统
立体重建方法 场景 转换器模块 注意力 重建系统
2
用于AI外呼的案件筛选方法、装置、设备、介质、产品
案件 筛选方法 数值 机器人 处理器
3
一种基于规则引擎技术的采购成本智能对账方法
规则引擎技术 业务系统 场景分类 构建规则库 数据
4
核电图纸数字化校对方法、系统、介质和设备
校对方法 格式图纸 报告 图像增强 校对系统
5
模型训练方法、装置及数据生成方法
掩码矩阵 生成对抗网络 模型训练方法 数据生成方法 非易失性存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号