摘要
本申请适用于芯片设计技术领域,提供了算子配置方法、深度学习编译器、智能设备及存储介质,包括步骤:生成所述算子的初始化配置集合;所述初始化配置集合包括多个初始配置;分别计算所述初始化配置集合中各个初始配置的语句计算总时延;根据所述语句计算总时延,自所述初始化配置集合中筛选出部分初始配置,形成第一配置集合;分别对所述第一配置集合中的各个初始配置进行硬件执行性能预测,得到各所述初始配置对应的预测结果;根据所述初始配置对应的预测结果,自所述第一配置集合中确定目标配置;根据所述目标配置,对所述算子进行配置;本申请提高了深度学习编译器寻找最优算子配置时的搜索效率。
技术关键词
语句
时延
硬件平台
内存
智能设备
芯片设计技术
可读存储介质
处理器
存储器
计算机
数据
参数
指标
解码
编码
系统为您推荐了相关专利信息
大语言模型
问答系统
自然语言
向量检索技术
问答方法
物理设备
虚拟设备
服务组件
设备标识符
虚拟机管理器