基于压缩权重的模型训练与推理方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411810402

申请日期：2024-12-10

公开号：CN119740623A

公开日期：2025-04-01

类型：发明专利

摘要

本申请公开了一种基于压缩权重的模型训练与推理方法、装置、设备及存储介质，涉及模型训练与推理技术领域，公开了基于压缩权重的模型训练与推理方法，包括：获取预设模型的初始权重矩阵；根据初始权重矩阵得到初始权重矩阵块，并根据初始权重矩阵块得到初始权重；根据初始权重得到权重指数位和权重尾数位，并根据权重指数位得到尾数保留值；根据权重指数位、尾数保留值以及和权重尾数位对初始权重进行压缩，得到压缩权重；在检测到预设模型的前向传播或反向传播时，解压压缩权重，得到目标权重，并根据目标权重对预设模型进行训练和推理。通过将模型权重的指数位和尾数保留值对权重进行压缩和解压，能够在保持模型性能的同时减少内存占用。

技术关键词

推理方法指数矩阵推理技术推理装置策略更新处理器模块误差可读存储介质存储器分块内存符号计算机编码

系统为您推荐了相关专利信息

基于IMU的绳驱械臂臂段末端姿态等效控制方法及装置

等效控制方法关节驱动绳索 PID控制器机械臂基座

一种生物多样性指标提取方法、装置、设备、介质及产品

指标提取方法光学遥感影像影像处理单元样本数据获取单元

一种基于人脸识别的课堂评价辅助方法

学生语义分析模型座位语音识别模型自然语言模型

基于RBMGC优化算法的相干自由空间光通信系统

自由空间光通信系统波前校正器无波前传感器系统优化算法策略

一种基于混合高斯的毫米波雷达和单目相机时间校准方法

单目相机雷达混合高斯模型时间校准方法标靶

基于压缩权重的模型训练与推理方法、装置、设备及存储介质

站点导航

APP 下载