一种长上下文下的大模型芯片预填充阶段推理优化方法、系统及应用

AITNT
正文
推荐专利
一种长上下文下的大模型芯片预填充阶段推理优化方法、系统及应用
申请号:CN202510178880
申请日期:2025-02-18
公开号:CN120124741A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种长上下文下的大模型芯片预填充阶段推理优化方法,所述推理优化方法包括如下步骤:步骤一、对预填充阶段的输入数据和模型参数动态进行切片;步骤二、依次并行加载和计算QKV、self‑attention、attention_project、FFN模块,在所述attention_project和所述FFN模块的加载计算后进行残差连接处理;步骤三、完成整个推理计算。本发明还公开了实现上述推理优化方法的推理优化系统,及相应的应用,具有广泛应用场景。
技术关键词
切片 多头注意力机制 前馈神经网络 静态随机存取存储器 时间片 队列 投影模块 执行矩阵乘法 硬件系统 阶段 输出模块 数据存储 分支 元素 芯片
系统为您推荐了相关专利信息
1
基于预训练代码语言模型和卷积神经网络的漏洞检测方法
漏洞检测方法 卷积神经网络模块 序列 判断源代码 数据
2
基于生成式神经网络模型的水网水质时空预测方法
监测站 时空预测方法 指标 神经网络模型 序列
3
一种基于5G切片专网的低空通讯动态路由实现方法及系统
网络节点 虚拟网络 网络切片创建 资源约束条件 传输路径
4
一种多材料投影光固化生物3D打印设备及方法
打印平台 打印设备 打印方法 清洗剂 骨髓间充质干细胞
5
基于自监督学习的多源异构图像分割方法
分支 图像分割方法 样本 图像分割模型 可见光
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号