摘要
本发明提供一种基于异构系统级芯片的模型推理加速装置和方法,涉及人工智能技术领域,包括处理系统端和可编程逻辑端;处理系统端包括文本分词模块和指令控制模块;可编程逻辑端包括指令解码模块、调度模块、矩阵运算模块、稀疏控制模块、存储控制模块、片上内存模块。本发明提供的装置和方法,能够适应不同规模的大型语言模型,支持模型的动态调整,实现了在计算资源有限的嵌入式设备中对大型语言模型的推理进行加速,提高了大型语言模型推理的计算效率。
技术关键词
异构系统
存储控制模块
数据存储单元
加速装置
内存模块
分词
芯片
文本
解码模块
非暂态计算机可读存储介质
矩阵
生成输出数据
外部存储设备
滑动窗口
逻辑
自定义函数
指令
系统为您推荐了相关专利信息
高速公路弯道
闯入预警系统
警示装置
预警方法
定向声波
主机控制系统
多传感器融合感知
多自由度机械
位移传感器
感知系统
温湿度传感器模块
递归最小二乘法
多功能显示单元
实验室环境控制
控制指令生成单元
智能嗅觉
数据存储单元
局部通风装置
芯片
深度学习算法
数据采集层
管控方法
管控系统
异构系统
数据存储