摘要
本发明公开了一种多GPU平台上8×8块离散余弦变换(DCT8×8)算法的并行优化方法,该方法包括如下步骤:重构GPU端DCT8×8算法执行逻辑;对输入图像进行数据初始化和数据读取操作;依据读取的数据大小自适应地选择所需的GPU个数;对输入图像进行行块划分;设计算法执行时输入数据,执行多GPU平台DCT8×8计算并验证。本发明的目的在于处理海量图像数据时,针对目前8×8块离散余弦变换在图像压缩等领域计算效率低下的问题,提出了一种在多GPU平台上8×8块离散余弦变换算法的并行化实现与优化方法。利用DCT变换矩阵的对称性重构GPU端算法执行逻辑,通过输入的图像的总大小和平台GPU的峰值吞吐量,利用自适应资源调度方法自动选择满足计算所需要的GPU数量,免去手动选择GPU个数造成的资源浪费情况,然后根据选择的GPU个数,通过对输入图像进行行块划分,实现GPU间的负载均衡。通过以上方法提高多GPU平台的资源利用率,从而达到DCT8×8算法计算效率的提升。
技术关键词
并行优化方法
离散余弦变换
多GPU平台
像素块
海量图像数据
资源调度方法
重构算法
逻辑
图像压缩
像素点
矩阵
色彩
策略
系统为您推荐了相关专利信息
图像压缩方法
分块
离散余弦变换
编码规则
计算机程序产品
LSTM神经网络
线缆
管理方法
绝缘电阻值
样本
电力变压器故障
电力设备故障
识别方法
分支
信号
医学图像分割
协方差矩阵
演化策略
非局部均值滤波
算法