一种面向大型语言模型的动态层裁剪系统和方法

正文

推荐专利

申请号：CN202510652953

申请日期：2025-05-21

公开号：CN120181137B

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及一种面向大型语言模型的动态层裁剪系统和方法，通过设置转换模块以将输入音频信号转化为多段等编码长度的输入标记的嵌入表示，通过设置路由调节装置以替代传统大型语言模型的转换器模型架构，采用全局标记感知路由算法动态调整计算资源分配，避免了固定资源分配导致的效率低下问题，提高了推理效率，减少了不必要的计算量。并且，路由调节装置将每段输入标记的嵌入表示进行多次感知估计映射和自注意估计映射以获得相应的输出标记，从而实现在转换器模型架构中解耦多层感知机和自注意力层的裁剪策略，使得计算资源分配更加合理，有效避免了统一裁剪所导致的资源浪费，同时保持了模型性能。

技术关键词

裁剪系统转换器模块路由器网络单元代表标记注意力资源分配参数网络结构动态裁剪方法算法多层感知机两阶段策略编码矩阵

系统为您推荐了相关专利信息

考虑碳排放流的海量空调多目标日前优化调度方法及系统

日前优化调度方法空调负荷优化调度系统偏差

一种用于散乱介质下的偏振成像方法

偏振成像方法偏振成像系统恢复相位信息偏振图像信息介质

一种基于智能数据处理的物联网路由器网络管理方法

路由器智能数据处理网络管理方法样本比例分配公式

一种能够考虑侧向机动影响的高超声速滑翔轨迹高精度解析求解方法

解析求解方法飞行动力学模型广义多项式坐标系

一种带噪多模态开放词汇视觉样本分类方法及系统

样本分类方法跨模态视觉特征编码样本分类系统网络

一种面向大型语言模型的动态层裁剪系统和方法

站点导航

APP 下载