一种面向大型语言模型的动态层裁剪系统和方法

AITNT
正文
推荐专利
一种面向大型语言模型的动态层裁剪系统和方法
申请号:CN202510652953
申请日期:2025-05-21
公开号:CN120181137B
公开日期:2025-10-03
类型:发明专利
摘要
本发明涉及一种面向大型语言模型的动态层裁剪系统和方法,通过设置转换模块以将输入音频信号转化为多段等编码长度的输入标记的嵌入表示,通过设置路由调节装置以替代传统大型语言模型的转换器模型架构,采用全局标记感知路由算法动态调整计算资源分配,避免了固定资源分配导致的效率低下问题,提高了推理效率,减少了不必要的计算量。并且,路由调节装置将每段输入标记的嵌入表示进行多次感知估计映射和自注意估计映射以获得相应的输出标记,从而实现在转换器模型架构中解耦多层感知机和自注意力层的裁剪策略,使得计算资源分配更加合理,有效避免了统一裁剪所导致的资源浪费,同时保持了模型性能。
技术关键词
裁剪系统 转换器模块 路由器 网络单元 代表 标记 注意力 资源分配 参数 网络结构 动态 裁剪方法 算法 多层感知机 两阶段 策略 编码 矩阵
系统为您推荐了相关专利信息
1
考虑碳排放流的海量空调多目标日前优化调度方法及系统
日前优化调度方法 空调 负荷 优化调度系统 偏差
2
一种用于散乱介质下的偏振成像方法
偏振成像方法 偏振成像系统 恢复相位信息 偏振图像信息 介质
3
一种基于智能数据处理的物联网路由器网络管理方法
路由器 智能数据处理 网络管理方法 样本 比例分配公式
4
一种能够考虑侧向机动影响的高超声速滑翔轨迹高精度解析求解方法
解析求解方法 飞行动力学模型 广义 多项式 坐标系
5
一种带噪多模态开放词汇视觉样本分类方法及系统
样本分类方法 跨模态 视觉特征编码 样本分类系统 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号