摘要
本申请涉及人工智能编译器技术领域,具体涉及一种基于多级中间表示框架的AI编译器及编译方法,编译器包括:高层语义保留层,将不同AI框架的模型转换为Linalg‑on‑Tensor IR中间表示;硬件感知优化层,包括:张量打包传播模块,用于对输入张量执行分块打包、布局传播及冗余打包/解包操作的折叠;动态分块模块,基于目标硬件的缓存容量和核心数自动选择分块尺寸;微内核融合模块,将矩阵乘法、偏置加法及激活函数融合为单一复合算子;微内核协同层,通过XSMM方言与硬件加速库对接,生成目标硬件代码。硬件感知优化层能够针对不同硬件特性进行优化,使得编译器生成的代码能够更好地适配目标硬件,提高硬件利用率。
技术关键词
生成可执行文件
分块
编译方法
框架
缓存命中率
动态
嵌套结构
语义
编译器技术
布局
模块
逻辑
核心
参数
冗余
尺寸
矩阵
数学
标志
标记
系统为您推荐了相关专利信息
节点特征
特征提取方法
Attention机制
交互特征
注意力机制
深度神经网络
向量寄存器堆
全局数据结构
分块
自定义指令
监控预警方法
离子泵
图片
电流值
计算机可读指令
宽度神经网络
宽度学习系统
样本
数据
背景噪声干扰