一种基于FPGA的高性能大语言模型加速器及推理方法

正文

推荐专利

申请号：CN202510157119

申请日期：2025-02-12

公开号：CN119990213A

公开日期：2025-05-13

类型：发明专利

摘要

本申请公开了一种基于FPGA的高性能大语言模型加速器及推理方法，采用多计算单元(CU)和矩阵处理单元(MPE)相结合的结构，借助FPGA的并行计算能力，能够高效地分配计算任务并实现并行处理，从而大幅提升了计算效率。通过并行化处理多个任务，显著提高了推理速度，避免了传统方案中的计算瓶颈。其次，在内存管理方面，本发明通过高带宽内存(HBM)和片外内存(如DDR)的混合存储策略，优化了内存带宽的利用，实现了数据在多个计算单元之间的高效流动，减少了数据传输中的延迟，确保了计算过程中的高效数据访问。

技术关键词

大语言模型加速器高性能内存管理模块高带宽处理单元推理方法动态分配内存 FPGA平台数据流结构数据访问数据存储位置数据传输延迟多通道并行矩阵周期性主机

系统为您推荐了相关专利信息

一种流程工业文本知识提取数据集自动构建方法及系统

自动构建方法大语言模型实体置信度阈值信息数据处理终端

基于多模态图检索增强生成的多角色数字人构建方法

生成技术预训练语言模型大语言模型多模态信息图像处理模型

基于适配度矩阵的异构通用GPU任务优化调度方法及系统

优化调度方法矩阵异构遗传算法求解优化调度系统

匹配度评估模型的训练方法、匹配度评估方法及装置

搜索词关键词网络匹配度评估方法大语言模型

基于多模态大语言模型的工地安监智能体系统

智能体系统大语言模型安监工地视觉特征编码

一种基于FPGA的高性能大语言模型加速器及推理方法

站点导航

APP 下载