摘要
本申请提供一种算子融合方法、系统、设备及介质,包括获取当前硬件平台的加速芯片配置信息和计算图包含的算子类型信息;输入获取到的加速芯片配置信息、算子类型信息以及计算图至已训练好的算子融合模型以输出目标算子;其中,算子融合模型通过加载与加速芯片配置信息匹配的目标第一配置文件和与算子类型信息匹配的目标第二配置文件调整算子融合模型内的低秩权重调整参数以适配硬件平台和算子类型。通过动态加载与当前硬件和算子类型相关的配置文件,实现在面对算法和应用需求变化以及不同的加速芯片架构时,自动调整算子实现,确保在不同任务场景中的性能一致性和可靠性。
技术关键词
编码向量
算子融合方法
硬件平台
芯片架构
多层感知器
参数
模块
场景
存储程序指令
存储计算机程序
融合系统
数据
编码器
电子设备
处理器
可读存储介质
存储器
系统为您推荐了相关专利信息
检测识别方法
识别检测方法
多尺度特征提取
表面缺陷检测
视觉
微电网
编排方法
深度强化学习模型
节点
编解码器
软件性能优化方法
芯片架构
部署Kubernetes集群
支持人工智能
内存
监测站
拓扑网络
水质预测方法
门控循环单元
时序预测模型
文本分类模型
预编码向量
样本
神经网络模型训练
特征值