摘要
本发明公开了一种利用3D注意力机制的视频生成模型的加速方法及加速器,该方法中,进行注意力计算过程包括:采用规约推测方式检验注意力计算中的重要部分,对于重要部分采用FP‑FP的方式计算矩阵乘法,对于非重要部分采用FP‑INT的方式计算矩阵乘法;采用FP‑INT的方式计算矩阵乘法的过程中,混合计算引擎通过查表的方式获取浮点数尾数与整形的乘积。通过基于推测的相似性检测方法和缓存查找表架构,显著减少了注意力计算的冗余操作,将原注意力计算过程中超过65%的高开销FP‑FP计算替换为低开销的FP‑INT计算,逼近提高了效率,还降低了视频生成过程中的能耗,使得大规模视频生成任务更加经济高效。
技术关键词
视频生成模型
矩阵
注意力机制
浮点数
推测方式
相似性检测方法
加速器
查表乘法器
查找表架构
索引表
处理单元
数值
因子
表达式
冗余
指数
能耗
指标
系统为您推荐了相关专利信息
情绪状态识别方法
面向多模态数据
神经网络模型
深度学习模型
情绪识别模型
注意力神经网络
长短期记忆网络
注意力机制
Sigmoid函数
深度特征学习