大语言模型压缩方法、装置、设备及存储介质

AITNT
正文
推荐专利
大语言模型压缩方法、装置、设备及存储介质
申请号:CN202510612690
申请日期:2025-05-13
公开号:CN120123803B
公开日期:2025-09-23
类型:发明专利
摘要
本公开涉及人工智能技术领域,尤其涉及一种大语言模型压缩方法、装置、设备及存储介质。所述方法包括:对大语言模型的各个线性层的权重进行聚类,得到多个聚类中心;对于每个所述权重,计算所述权重与目标聚类中心之间的残差,并对所述残差进行分解,得到分解残差,其中所述目标聚类中心为距离所述权重最近的聚类中心;根据所述多个聚类中心和每个所述权重的分解残差,对所述大语言模型进行压缩。本公开实施例通过对各个线性层的权重采用聚类和残差处理,实现对大语言模型权重的高效压缩,同时尽可能保持模型的性能。
技术关键词
大语言模型 残差矩阵 非易失性计算机可读存储介质 K均值聚类算法 线性 人工智能技术 压缩装置 处理器 服务器 尺寸 模块 存储器 人类 终端 定义 关系
系统为您推荐了相关专利信息
1
面向配电网信息物理系统的网络安全风险定量评估方法
网络安全风险 定量评估方法 信息物理系统 面向配电网 分类预测模型
2
一种用于鼓式土工离心机内的六自由度加载装置
角位移伺服系统 离心机模型箱 土工离心机 激光位移传感器 铰支座
3
混凝土减水剂配方优化方法
混凝土减水剂 材料分析设备 非线性 参数 计算机辅助工程技术
4
一种基于大模型的精准搜索方法、装置及设备
搜索方法 实体 画像 条目 大语言模型
5
LED灯具及其线性恒流驱动电路、LED灯具的驱动方法
线性恒流驱动电路 基准电压模块 场效应管 运算放大器输出 LED灯具
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号