摘要
本发明公开了Triton算子调用核函数的方法、装置和电子设备,涉及人工智能技术领域。该方法包括:构建Triton算子的运行时结构,若核函数首次调用且为单核心,则通过JITFunction来编译核函数,若核函数首次调用且为多核心,则整体调整得到全局性能最佳的编译参数,若核函数非首次调用,则通过LibEntry中的映射表获取核函数,所述映射表中写有编译参数和对应的核函数或最佳的编译参数和对应的核函数。实践表明,本发明提供的方案可在小规模的函数调用中,将端到端的时间开销降低约70%。而且,通过全局调优的方式扩大了多核心算子的参数调优空间,提升了配置参数的自由度,提高了归约类算子的计算效率。
技术关键词
参数
键值
核心
装饰
包装
综合性
标记
电子设备
处理器
人工智能技术
锁模块
变量
存储器
分块
指令
小规模
关键字
程序
流水
系统为您推荐了相关专利信息
数控机床智能
温度补偿参数
材料热膨胀系数
工位
温度补偿方法
关键视觉信息
图像生成模型
图文
主题关键词
风格
模拟图像生成方法
运动
坐标系
参数
接口转换模块
北斗高精度定位
位置信息获取方法
代表
基准
协方差矩阵