基于昇腾芯片的大模型推理算子优化方法、装置及设备

AITNT
正文
推荐专利
基于昇腾芯片的大模型推理算子优化方法、装置及设备
申请号:CN202510710884
申请日期:2025-05-28
公开号:CN120654816A
公开日期:2025-09-16
类型:发明专利
摘要
本发明涉及人工智能领域,技术方案可应用在金融科技/医疗健康领域。公开了一种基于昇腾芯片的大模型推理算子优化方法、装置及设备,包括:根据昇腾芯片的并行计算能力,对原始输入数据进行分块处理,生成适配芯片计算单元的分块数据;基于所述分块数据,结合昇腾芯片的内存层次结构和计算核心类型,优化矩阵乘法算子的内存访问路径,并调整卷积运算的滑动步长及填充方式;将大模型中连续执行的多个算子融合为复合算子,优化复合算子的数据存储流程,并通过动态分配计算资源实现协同执行;对协同优化后的分块计算结果进行整合与解码,通过验证反馈机制调整输入数据分块策略及算子执行参数,形成闭环优化。本技术方案能够提升大模型的推理效率。
技术关键词
分块策略 芯片 内存 数据存储 并行计算单元 矩阵 后处理模块 核心 可读存储介质 识别误差 医疗健康 闭环 机制 处理器 参数 优化装置 解码 资源分配
系统为您推荐了相关专利信息
1
半导体模块和半导体模块的制造方法
半导体模块 导电体 安装基板 半导体芯片 接合材料
2
一种柔性面状温度控制器及控制方法
发热电路 发热单元 温度检测电路 温度控制器 排布电路
3
块随机存取存储器控制方法、块随机存取存储器
P型晶体管 存储器控制方法 存储阵列 模式 电压
4
一种基于大语言模型的长对话用户行为分析方法
大语言模型 分析方法 记忆 模块 注意力机制
5
一种基于光连接的高性能RoCE网络
模型训练模块 存储模块 高性能 交换机 光网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号