摘要
本发明涉及一种基于核函数预加载的CUDA代码优化设计方法,包括:步骤1,搜索已定义和被调用的kernel核函数;步骤2,定义kernel预加载函数集合;步骤3,声明并调用kernel预加载函数;步骤4,运行CUDA代码并对比优化前后性能。本发明采用将kernel函数预先加载到GPU的方式,为kernel核函数在GPU上预先准备了资源空间,优化了kernel核函数计算的性能,提升了CUDA代码的整体性能,支持英伟达GPU平台、国产GPU平台,以及基于CUDA框架开发的程序代码,主要解决了CUDA代码核函数运行性能不高的问题。
技术关键词
算法模块
定义
信息处理程序
关键字
平台
指针
雷达
规模
变量
框架
资源
参数
系统为您推荐了相关专利信息
李雅普诺夫函数
大数据建模技术
学习算法
鲁棒性
框架
民意调查方法
深度学习模型
关键词
数据调查技术
数据分析软件
政务服务平台
信息推荐方法
页面
信息推荐模型
关系
比例模型
模型构建方法
IGBT模块
仿真数据
神经网络单元