一种基于CUDA张量核心的离散傅里叶检测实现方法和系统

    公开(公告)号:CN119719767A

    公开(公告)日:2025-03-28

    申请号:CN202411682590.0

    申请日:2024-11-22

    Abstract: 本发明属于随机性检测领域,涉及一种基于CUDA张量核心的离散傅里叶检测实现方法和系统。该方法包括:利用NVIDIA GPU的张量核心的特性,在CUDA架构上实现基数为10的离散傅里叶变换DFT;利用基数为10的离散傅里叶变换进行内核融合,将多个小内核融合成大内核,对大尺寸输入数据进行分解与重组,从而优化快速傅里叶变换FFT的运算的执行。本发明还使用CUDA流在执行流程进行了优化,能够充分发挥CUDA架构的优势,提升了数据处理的效率和算法的执行速度。本发明在处理大规模数据集时,能够提供与现有技术相比更高的性能。

Patent Agency Ranking