摘要
本发明公开了一种大语言模型模块化推理计算系统、方法、装置及介质。通过对大语言模型模块化推理计算系统中的文本嵌入模块、多簇注意力模块、多层感知机模块和线性映射模块分别进行不同单元的配置,来实现对输入文本令牌序列的生成词令牌的计算,另外的,对注意力机制计算数据流方法和线性层计算数据流方法进行了改进。解决了现有技术中受限于外部存储带宽,将难以充分发挥芯片的计算效率、性能差和对专业人员要求高的问题,实现了构建更加完善的大语言模型,设计了高吞吐的计算数据流,能够充分发挥芯片的算力。
技术关键词
令牌
文本
数据流方法
序列
大语言模型
注意力机制
线性
矩阵
查询特征
多层感知机
查找表
模块
字典
计算方法
因子
可读存储介质
计算机
处理器
键特征
系统为您推荐了相关专利信息
嵌入特征
多尺度卷积神经网络
蛋白
融合特征
识别模型训练
矩阵
管道检测机器人
滑动窗口
缺陷智能
生成管道