一种大语言模型模块化推理计算系统、方法、装置及介质

AITNT
正文
推荐专利
一种大语言模型模块化推理计算系统、方法、装置及介质
申请号:CN202411496525
申请日期:2024-10-25
公开号:CN119005275B
公开日期:2025-05-02
类型:发明专利
摘要
本发明公开了一种大语言模型模块化推理计算系统、方法、装置及介质。通过对大语言模型模块化推理计算系统中的文本嵌入模块、多簇注意力模块、多层感知机模块和线性映射模块分别进行不同单元的配置,来实现对输入文本令牌序列的生成词令牌的计算,另外的,对注意力机制计算数据流方法和线性层计算数据流方法进行了改进。解决了现有技术中受限于外部存储带宽,将难以充分发挥芯片的计算效率、性能差和对专业人员要求高的问题,实现了构建更加完善的大语言模型,设计了高吞吐的计算数据流,能够充分发挥芯片的算力。
技术关键词
令牌 文本 数据流方法 序列 大语言模型 注意力机制 线性 矩阵 查询特征 多层感知机 查找表 模块 字典 计算方法 因子 可读存储介质 计算机 处理器 键特征
系统为您推荐了相关专利信息
1
一种基于用户交互说明图的安卓应用任务自动化方法
自动化方法 节点 元素 布局 静态分析技术
2
鉴权认证方法、系统、电子设备及存储介质
识别码 鉴权认证方法 解密 加密数据 索引
3
纠缠编码量子直接通信方法及系统
量子态 信息编码 信道 序列 编码算法
4
基于蛋白质语言模型与多尺度卷积神经网络的Cas蛋白识别方法及系统
嵌入特征 多尺度卷积神经网络 蛋白 融合特征 识别模型训练
5
基于深度学习的地下管网缺陷智能识别与预警方法及系统
矩阵 管道检测机器人 滑动窗口 缺陷智能 生成管道
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号