一种基于FPGA的高性能大语言模型加速器及推理方法

AITNT
正文
推荐专利
一种基于FPGA的高性能大语言模型加速器及推理方法
申请号:CN202510157119
申请日期:2025-02-12
公开号:CN119990213A
公开日期:2025-05-13
类型:发明专利
摘要
本申请公开了一种基于FPGA的高性能大语言模型加速器及推理方法,采用多计算单元(CU)和矩阵处理单元(MPE)相结合的结构,借助FPGA的并行计算能力,能够高效地分配计算任务并实现并行处理,从而大幅提升了计算效率。通过并行化处理多个任务,显著提高了推理速度,避免了传统方案中的计算瓶颈。其次,在内存管理方面,本发明通过高带宽内存(HBM)和片外内存(如DDR)的混合存储策略,优化了内存带宽的利用,实现了数据在多个计算单元之间的高效流动,减少了数据传输中的延迟,确保了计算过程中的高效数据访问。
技术关键词
大语言模型 加速器 高性能 内存管理模块 高带宽 处理单元 推理方法 动态分配内存 FPGA平台 数据流结构 数据访问 数据存储位置 数据传输延迟 多通道并行 矩阵 周期性 主机
系统为您推荐了相关专利信息
1
一种流程工业文本知识提取数据集自动构建方法及系统
自动构建方法 大语言模型 实体 置信度阈值 信息数据处理终端
2
基于多模态图检索增强生成的多角色数字人构建方法
生成技术 预训练语言模型 大语言模型 多模态信息 图像处理模型
3
基于适配度矩阵的异构通用GPU任务优化调度方法及系统
优化调度方法 矩阵 异构 遗传算法求解 优化调度系统
4
匹配度评估模型的训练方法、匹配度评估方法及装置
搜索词 关键词 网络 匹配度评估方法 大语言模型
5
基于多模态大语言模型的工地安监智能体系统
智能体系统 大语言模型 安监 工地 视觉特征编码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号