用于神经网络模型的数据处理方法、服务器、设备及介质

正文

推荐专利

申请号：CN202411643350

申请日期：2024-11-18

公开号：CN119167991B

公开日期：2025-03-21

类型：发明专利

摘要

本申请涉及人工智能技术领域，具体提供一种用于神经网络模型的数据处理方法、服务器、设备及介质，旨在解决如何基于移动设备的CPU对神经网络模型进行注意力计算的问题。本申请提供的方法包括根据神经网络模型的模型文件获取第一计算图，第一计算图用于描述神经网络模型的所有算子以及各算子之间的连接关系；获取第一计算图中的多个目标算子，多个目标算子为用于Transformer模块进行注意力计算的多个算子；对多个目标算子对应的计算操作进行融合，以形成一个融合算子，融合算子用于移动设备的CPU执行计算操作；将多个目标算子替换为融合算子得到第二计算图。通过上述方法可以基于CPU执行融合算子对应的计算操作，提高注意力计算的速度，从而提高模型推理速度。

技术关键词

神经网络模型数据处理方法矩阵移动设备内存排布方式注意力机制通道处理器通信服务器人工智能技术存储器元素关系进程数据存储可读存储介质

系统为您推荐了相关专利信息

一种面向电磁信号识别的深度神经网络黑盒攻击方法

电磁信号识别深度神经网络决策样本拉丁超立方采样

基于人工智能的光伏组件寿命预测系统及方法

寿命预测系统光伏组件分层特征波动特征数值

一种基于纠删码高可用分布式内存池实现方法

分布式内存节点内存页面换入换出虚拟机实例内存监控器

数据处理方法、密码服务模块、芯片及电子装置

模数数据处理方法密码芯片指令电子装置

磁特性数据融合的材料损伤智能诊断方法及系统

损伤特征演化特征磁畴壁磁矫顽力智能诊断方法

用于神经网络模型的数据处理方法、服务器、设备及介质

站点导航

APP 下载