一种基于极坐标体系的大模型量化压缩方法及系统

AITNT
正文
推荐专利
一种基于极坐标体系的大模型量化压缩方法及系统
申请号:CN202510510093
申请日期:2025-04-23
公开号:CN120046664B
公开日期:2025-07-15
类型:发明专利
摘要
本发明属于人工智能技术领域,为解决现有的大语言模型量化方法无法同时保障大模型的低成本硬件部署和推理效率的问题,提供一种基于极坐标体系的大模型量化压缩方法及系统。其中,基于极坐标体系的大模型量化压缩方法包括从第一存储单元中调取预存的大语言模型的原始权重参数分布,并将其处理成标准高斯分布,得到相应符合标准高斯分布的权重矢量,再转化为对应极坐标表征;分别构建各个所述极坐标表征的方向码本和模长码本,得到符合分布特征和量化敏感度特性的矢量码本并传输至第二存储单元进行存储。其能够同时保障大模型的低成本硬件部署和推理效率。
技术关键词
概率密度函数 存储单元 索引 大语言模型 分布特征 贪心算法 协方差矩阵 参数 处理器 人工智能技术 压缩系统 计算机程序产品 低成本 存储模块 可读存储介质 格式 存储器 元素
系统为您推荐了相关专利信息
1
一种心理疏导系统、方法、终端及存储介质
交互终端 循环神经网络模型 服务端 大语言模型 Word2Vec模型
2
一种基于大语言模型的财务数据深度分析方法
关联特征数据 财务 深度分析方法 大语言模型 企业
3
一种基于角色的NFT和进化博弈论的区块链增强型数据证明架构
溯源信息 进化博弈论 演化博弈论 代币 动态
4
基于大模型文档索引感知的对话式生成检索方法及系统
标识符 检索方法 索引 生成文档 大语言模型
5
模型量化方法和装置、电子设备及存储介质
神经网络模型 索引 电子设备 可读存储介质 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号