摘要
本发明属于计算机技术领域,涉及一种通用并行程序扩展为众核处理器并行程序的方法及系统,方法的步骤为:确定CUDA主程序中的核函数在main函数中的位置;确定核函数传入参数值;将CUDA程序的host代码映射为SW26010处理器的任务主核代码,明确任务主核数量;根据参数值确定SW26010处理器的计算主核数量和单个计算主核中的从核数量;任务主核分配计算数据块给计算主核,计算主核分配计算任务给从核阵列;从核执行计算任务得到计算结果;计算主核收集从核阵列中所有计算结果;任务主核将收集的所有计算主核的数据块计算结果合并为最终结果。本发明有效提升程序移植效率,成本低。
技术关键词
处理器
阵列
数据传输模块
坐标
程序
关键字
参数
网格
标记
算法
系统为您推荐了相关专利信息
资源调度方法
决策网络模型
节点
平均等待时间
资源分配