摘要
本申请公开了一种异构编译优化的方法、设备及介质,涉及计算机软件技术领域,用于解决编译器如何准确合理地设置线程层次结构的问题。方法包括:编译器编译程序时,检测到优化线程结构的宏后,设定迭代次数阈值、动态变化的迭代耗时逼近阈值和目标线程访问耗时。查询GPU硬件参数确定初始线程块和网格参数值并编译程序,获取运行时线程访问耗时。对比该耗时与目标耗时、迭代次数阈值及动态阈值,若满足条件则执行迭代编译,调整线程块和网格参数值后重新编译。如此循环,直至得出优化的线程块和网格参数值,逼近目标线程访问耗时,优化线程层次结构,这种迭代调整线程块和网格大小的方式,大幅提升程序性能。
技术关键词
异构编译优化方法
层次结构数据
网格
样本
神经网络模型
动态
计算机可执行指令
计算机软件技术
程序
多处理器
优化设备
表达式
处理器通信
图表
存储器
客户端
介质
系统为您推荐了相关专利信息
机载高光谱
柱体
稀疏特征
多头注意力机制
卷积模块
深度学习分类模型
非标准
卷积神经网络模型
执行断层扫描
路径生成算法
协同控制系统
概念
多机器人协作
非暂态计算机可读存储介质
网络结构
图书知识图谱
图书推荐系统
个性化知识图谱
多层感知机
神经协同过滤