面向多核并行体系结构的卷积算子编译优化方法及装置

AITNT
正文
推荐专利
面向多核并行体系结构的卷积算子编译优化方法及装置
申请号:CN202411825773
申请日期:2024-12-12
公开号:CN119759357B
公开日期:2025-11-21
类型:发明专利
摘要
本发明提出一种面向多核并行体系结构的卷积算子编译优化方法和装置。包括:输入转换器模块提取和去重模型中的或者用户输入的卷积参数,并生成卷积描述符组;控制器模块根据历史记录决定是否对输入模块启动调优,将需要调优的卷积描述符传递给调优器模块;调优器模块负责根据配置好的参数空间进行算子的自动调优,输出最佳参数配置;代码生成模块根据接收到的调优参数组合及卷积描述符生成HIP代码,并分别对各个参数生成的核函数进行对应编号。核函数执行模块编译和执行已生成的代码,并通过测试框架对各个核函数的性能进行测试,按编号返回对应的适应度信息并汇总为列表返回给调优器模块。
技术关键词
描述符 编译优化方法 神经网络加速器 多核并行 字典 模块 代码生成器 矩阵 硬件资源信息 信息显示设备 轮盘赌算法 模板 优化装置 格式 待测参数 分块策略 内存 流水 标识符
系统为您推荐了相关专利信息
1
基于图像识别模型的柔性线路板的缺陷检测方法及系统
柔性线路板 线路缺陷识别 图像识别模型 缺陷检测方法 多视角
2
地质数据切片方法、装置、设备及介质
数据切片方法 神经网络模型 参数 地层特征 字典
3
基于人工智能的离散型金属配位超分子笼结构预测方法
离散型金属 超分子笼 组装体 拓扑结构数据 机器学习模型训练
4
基于显著性分析的点云场景杆状物提取方法
物提取方法 点云 均值漂移算法 邻域 描述符
5
一种基于数据分析的人岗智能匹配模型管理方法及系统
模型管理方法 数据 偏好特征 重构 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号