摘要
本发明提供一种基于数据流分析的CUDA代码生成方法,包括基于目标硬件中多层内存的架构信息,将硬件感知算法转换为一个多内存层级数据流图,包括多个表示算法内不同操作任务的任务节点、多条仿射边和多个表示内存的缓存节点,缓存节点包括内存层级和内存数据,仿射边包括其连接的两个表示相邻层级的内存的缓存节点间的内存访问信息;将各个任务节点映射到目标硬件中,得到为各个任务节点的操作任务分配的目标硬件单元;以最大化所有操作任务的性能为优化目标调整各个缓存节点的内存数据的分块策略,得到内存数据分块结果;基于数据流图、内存数据分块结果、各个仿射边的内存访问信息,生成指示各个目标硬件单元执行操作任务的CUDA代码。
技术关键词
内存
节点
数据访问模式
代码生成方法
分块策略
层级
算法
硬件设备
缓存命中率
数据存储
指令
处理器
可读存储介质
变量
存储器
电子设备
逻辑
系统为您推荐了相关专利信息
天线接收器
MIMO预编码
节点特征
消息传递网络
邻居
信息提取模型
信息推荐方法
点击率
节点处
信息推荐装置
异步数据处理方法
分片
分布式任务调度
数据处理指令
计算机可读指令