一种基于数据流分析的CUDA代码生成方法

AITNT
正文
推荐专利
一种基于数据流分析的CUDA代码生成方法
申请号:CN202510127907
申请日期:2025-02-05
公开号:CN120104134B
公开日期:2025-11-25
类型:发明专利
摘要
本发明提供一种基于数据流分析的CUDA代码生成方法,包括基于目标硬件中多层内存的架构信息,将硬件感知算法转换为一个多内存层级数据流图,包括多个表示算法内不同操作任务的任务节点、多条仿射边和多个表示内存的缓存节点,缓存节点包括内存层级和内存数据,仿射边包括其连接的两个表示相邻层级的内存的缓存节点间的内存访问信息;将各个任务节点映射到目标硬件中,得到为各个任务节点的操作任务分配的目标硬件单元;以最大化所有操作任务的性能为优化目标调整各个缓存节点的内存数据的分块策略,得到内存数据分块结果;基于数据流图、内存数据分块结果、各个仿射边的内存访问信息,生成指示各个目标硬件单元执行操作任务的CUDA代码。
技术关键词
内存 节点 数据访问模式 代码生成方法 分块策略 层级 算法 硬件设备 缓存命中率 数据存储 指令 处理器 可读存储介质 变量 存储器 电子设备 逻辑
系统为您推荐了相关专利信息
1
基于同构图神经网络的可扩展MU-MIMO预编码方法
天线接收器 MIMO预编码 节点特征 消息传递网络 邻居
2
一种基于关键词与知识图谱的疾病概率推送与心电图检测开单系统的构建方法
疾病 关键词 三元组 深度学习模型 创建知识图谱
3
一种信息推荐方法、装置、存储介质及电子设备
信息提取模型 信息推荐方法 点击率 节点处 信息推荐装置
4
一种基于随机影响力子图的虚假信息抑制方法及系统
节点 可执行程序指令 邻居 网络 注意力
5
分布式异步数据处理方法、装置、计算机设备及存储介质
异步数据处理方法 分片 分布式任务调度 数据处理指令 计算机可读指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号