一种基于统计特征的大语言模型推理近似容错方法

AITNT
正文
推荐专利
一种基于统计特征的大语言模型推理近似容错方法
申请号:CN202410726251
申请日期:2024-06-06
公开号:CN118690691A
公开日期:2024-09-24
类型:发明专利
摘要
本发明提供了一种基于统计特征的大语言模型推理近似容错方法,属于电子设计自动化与计算系统的可靠性设计技术领域。本发明利用大语言模型错误统计特征,划定模型不同计算单元的错误危险区域,将大语言模型部署在基于统计ABFT电路的脉动阵列加速器上,在模型推理中,利用统计ABFT电路收集错误的统计信息,并计算判定错误的严重程度以决定是否触发纠错重算,从而减少模型重算开销;本发明统计ABFT电路能实现低成本的错误统计特征收集和错误的严重程度的判定,实现可靠、高效的模型推理,具有广阔的应用前景。
技术关键词
统计特征 大语言模型 容错方法 数据流结构 矩阵乘法运算 可靠性设计技术 电路 电子设计自动化 执行矩阵乘法 幅值 加速器 周期 加法器 直线 模块 纠错 参数 频率 处理单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号