一种基于轻量门控机制的大模型推理优化方法和系统

正文

推荐专利

申请号：CN202411614980

申请日期：2024-11-13

公开号：CN119721236A

公开日期：2025-03-28

类型：发明专利

摘要

本发明公开了一种基于轻量门控机制的大模型推理优化方法和系统，旨在提升大规模预训练模型在推理任务中的效率，并显著减少计算资源消耗。该方法首先对预训练模型进行初始化，在推理过程中引入动态路由机制，结合轻量门控和阈值判断机制，有效筛选推理过程中的关键层输出。通过对每层的输出进行动态评估，利用门控LSTM单元生成门控输出值，并通过sigmoid函数激活生成层的重要性分数。如果该分数低于预设阈值，则跳过该层计算，以减少不必要的计算开销。此优化策略能够自适应地判断每层输出的重要性，在保证模型输出质量的前提下，减少冗余计算，提高推理速度。本发明适用于多种任务场景，包括自然语言处理、图像生成等，具有广泛的应用价值。

技术关键词

机制预训练模型动态轻量级神经网络 sigmoid函数输出特征处理器存储器自然语言模块数据可读存储介质程序文本矩阵复杂度电子设备参数冗余速度

一种基于轻量门控机制的大模型推理优化方法和系统

站点导航

APP 下载