摘要
本发明属于随机性检测领域,涉及一种基于CUDA张量核心的离散傅里叶检测实现方法和系统。该方法包括:利用NVIDIA GPU的张量核心的特性,在CUDA架构上实现基数为10的离散傅里叶变换DFT;利用基数为10的离散傅里叶变换进行内核融合,将多个小内核融合成大内核,对大尺寸输入数据进行分解与重组,从而优化快速傅里叶变换FFT的运算的执行。本发明还使用CUDA流在执行流程进行了优化,能够充分发挥CUDA架构的优势,提升了数据处理的效率和算法的执行速度。本发明在处理大规模数据集时,能够提供与现有技术相比更高的性能。
技术关键词
内核
核心
CUDA架构
序列
数据
矩阵
尺寸
规模
模块
因子
算法
元素
定义
速度
系统为您推荐了相关专利信息
导流双极板
氢燃料电池
多尺度特征融合网络
图像综合特征
气密性测试装置
智能网联车辆
决策
面向高速公路
粒子群优化算法
加速度
接入认证方法
低空飞行器
标识特征
协议特征
多芯片
深度神经网络
遗传算法
节点
实数编码方法
采样点