一种面向Transformer加速器的多阶段动态稀疏优化方法

AITNT
正文
推荐专利
一种面向Transformer加速器的多阶段动态稀疏优化方法
申请号:CN202510217775
申请日期:2025-02-26
公开号:CN120146105A
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种面向Transformer加速器的多阶段动态稀疏优化方法,属于深度神经网络的加速器优化技术领域。解决了现有技术中传统的Transformer加速器推理阶段加速优化方法效率较低、效果较差的问题;本发明确定输入矩阵,对Transformer模型推理阶段进行独立的动态稀疏优化方法,即生成用于指导矩阵乘法的掩码矩阵,指导各个阶段的矩阵运算;通过提前的掩码生成方法对Transformer模型中数据流进行调整,提前生成各个阶段所需的掩码矩阵,加速矩阵运算,得到矩阵运算结果。本发明有效提升了Transformer加速器推理阶段的效率,减少了计算量,可以应用于优化Transformer加速器。
技术关键词
掩码矩阵 稀疏优化方法 加速器 阶段 掩码生成方法 近似计算方法 注意力 阈值生成方法 近似计算技术 动态 深度神经网络 元素 标记 线性 数值 符号
系统为您推荐了相关专利信息
1
一种面向互联网基础资源的数据交换方法及系统
互联网基础资源 数据交换系统 验证机制 数据发布 列表
2
元宇宙众包环境下多源非结构化文本服务的真值挖掘方法
挖掘方法 K均值聚类算法 答案 众包平台 生成特征
3
一种面向战术对抗的跨屏人机交互训练系统
人机交互训练 人体 指数 轮廓 建筑物
4
一种基于动态参考轨迹的固定翼飞机大迎角着陆控制方法
固定翼飞机 着陆控制方法 辅助线 坐标系 阶段
5
基于土地测量数据的预测模型训练方法及系统
预测模型训练方法 环境传感器数据 土壤湿度传感器 训练样本集 图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号