一种基于混合专家网络的高效生成式任务推理加速方法

正文

推荐专利

申请号：CN202510207765

申请日期：2025-02-25

公开号：CN120146184A

公开日期：2025-06-13

类型：发明专利

摘要

本发明的一种基于混合专家网络的高效生成式任务推理加速方法，包括：获取相关生成式任务的上下文信息，对上下文数据进行预处理，确保数据适合模型输入；构建基于混合专家网络的高效推理模型，确定基于混合专家网络的高效推理模型的推理流程；对混合专家网络的高效推理模型进行训练，优化模型参数，并保存最优的模型结构；利用最优模型结构生成推理结果。该方法改进的模型中，专家网络由多个独立的专家组成，每个专家负责处理不同的输入特征。门控网络根据输入特征动态地选择哪些专家参与计算，通过计算一个概率分布来为每个输入分配专家。通过这种方式，门控网络和专家网络紧密配合，确保只使用最合适的专家，从而提高计算效率和模型性能。

技术关键词

混合专家网络解码器结构前馈神经网络归一化模块超参数机器翻译注意力机制动态地文本基础路由器数据策略序列摘要分层

一种基于混合专家网络的高效生成式任务推理加速方法

站点导航

APP 下载