一种基于统计特征的大语言模型推理近似容错方法

正文

推荐专利

申请号：CN202410726251

申请日期：2024-06-06

公开号：CN118690691A

公开日期：2024-09-24

类型：发明专利

摘要

本发明提供了一种基于统计特征的大语言模型推理近似容错方法，属于电子设计自动化与计算系统的可靠性设计技术领域。本发明利用大语言模型错误统计特征，划定模型不同计算单元的错误危险区域，将大语言模型部署在基于统计ABFT电路的脉动阵列加速器上，在模型推理中，利用统计ABFT电路收集错误的统计信息，并计算判定错误的严重程度以决定是否触发纠错重算，从而减少模型重算开销；本发明统计ABFT电路能实现低成本的错误统计特征收集和错误的严重程度的判定，实现可靠、高效的模型推理，具有广阔的应用前景。

技术关键词

统计特征大语言模型容错方法数据流结构矩阵乘法运算可靠性设计技术电路电子设计自动化执行矩阵乘法幅值加速器周期加法器直线模块纠错参数频率处理单元

一种基于统计特征的大语言模型推理近似容错方法

站点导航

APP 下载