大模型压缩方法、装置、任务处理方法、设备及存储介质

AITNT
正文
推荐专利
大模型压缩方法、装置、任务处理方法、设备及存储介质
申请号:CN202510975683
申请日期:2025-07-15
公开号:CN120952084A
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及模型压缩技术领域,提供一种大模型压缩方法、装置、任务处理方法、设备及存储介质,该大模型压缩方法包括:对待压缩的初始大模型的线性层进行逐层量化,得到第一大模型;初始大模型是基于专家混合架构构建并经过预训练的大语言模型;对第一大模型中的各专家子模型进行路由校准,得到第二大模型;在第二大模型的推理过程中,基于待执行的目标任务的任务类型,评估各专家子模型在任务类型上的重要性;基于重要性对各专家子模型进行动态剪枝,以对第二大模型进行压缩。通过静态量化和动态剪枝相结合的压缩方式,可以在确保模型性能的基础上,减少大模型推理所需的内存和计算开销,有利于大模型在显存资源有限的轻量化设备上的高效运行。
技术关键词
模型压缩方法 动态剪枝 校准 非暂态计算机可读存储介质 轻量化设备 线性 混合层 处理器 文本 模块 存储器 注意力 矩阵 电子设备 内存 变量 资源 基础 参数
系统为您推荐了相关专利信息
1
桥梁预应力精细检测评估方法、装置及设备
检测评估方法 桥梁预应力 预应力钢绞线 完整性检测方法 变量
2
一种车载无线充电器温度与功率动态调节方法及系统
车载无线充电器 动态调节方法 电源管理模块 神经网络控制方法 校准温度传感器
3
声呐融合噪声检测的海洋生态监测浮标系统
声呐 海洋生态监测 浮标系统 步进电机驱动机构 水听器阵列
4
基于大模型的任务处理方法、装置、及存储介质
多轮对话 意图识别 非暂态计算机可读存储介质 业务办理效率 金融自助设备
5
一种TFT显示器生产中的高精度校准方法
TFT显示器 高精度校准方法 对比度 亮度 粒子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号