一种在Versal ACAP架构上的高效自注意力推理方法

AITNT
正文
推荐专利
一种在Versal ACAP架构上的高效自注意力推理方法
申请号:CN202510628839
申请日期:2025-05-16
公开号:CN120430341A
公开日期:2025-08-05
类型:发明专利
摘要
一种在Versal ACAP架构上的高效自注意力推理方法属于软硬件协同加速数值计算领域。首先,将自注意力的Softmax激活函数替换为激活函数,并将自注意力分块计算,这种分块计算方法更适用于硬件的设计。其次,在Versal ACAP架构上设计实现了自注意力的硬件加速器,使用Versal ACAP的AIE阵列实现AIE处理单元,并使用Versal ACAP的PL实现数据引擎为AIE处理单元提供数据和调度,使用片上DDR存储源数据与结果,三者组合为自注意力模块(ASA),用于承担自注意力的运算。实验证明,通过采用本发明的方法部署的加速器,有效提高了自注意力加速器的吞吐量,降低了推理延迟,同时此加速器在批量推理方面具有巨大的优势,并降低推理成本以及提升推理速度方面。
技术关键词
注意力 推理方法 处理单元 分块 矩阵 核心 硬件加速器 发送器 端口 模块 数据接收器 双缓冲模式 计算方法 内存 矢量处理器 元素 尺寸 阵列
系统为您推荐了相关专利信息
1
一种基于图像处理的无人机故障批量识别方法
无人机故障 构件故障 检测无人机 轻量级卷积神经网络 生成对抗网络
2
基于深度学习提取地震前地表纯净微波辐射异常的方法
记忆单元 地震 微波 深度学习模型 周期
3
课程信息的推荐方法和系统、电子设备
序列 矩阵 数据 推荐方法 教育信息处理
4
一种用于电动机机盖的上料装置
传送带 检测箱 视觉缺陷检测 上料系统 调节组件
5
一种智能生产工艺数据控制方法及系统
数据控制方法 黄磷电炉 状态空间模型 PID控制器 关键绩效指标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号