随着高性能计算与人工智能融合发展的不断深入,三维电磁数值模拟在雷达、光子晶体、地球物理勘探等领域的需求日益增长。作为电磁仿真中的核心方法之一,Crank-Nicolson有限差分时域(CN-FDTD)方法因其无条件稳定性特性,广泛应用于大规模长时间模拟。然而,该方法在每一步时间推进中需求解由双旋度算子构成的大型稀疏线性系统,计算开销巨大,成为限制其工程应用的瓶颈。
近日,我中心高性能计算部科研团队提出了一种基于离散变换的子域精确预处理系统——FlashMP,用于高效求解CN-FDTD方法中的线性系统。该方法首次在GPU集群上实现了对电磁方程预处理求解的实用加速,显著提升了大规模电磁模拟的计算效率。

基于离散变换与低秩修正的子域精确求解
FlashMP通过奇异值分解(SVD)将双旋度算子解耦为格点子系统,在每个子域内构建精确求解器作为预处理器,显著降低了迭代次数。同时,针对边界误差问题,团队设计了一种低秩修正策略。该方法在多GPU环境下具备良好的可扩展性,支持上千GPU并行计算。实验结果表明,在AMD MI60 GPU集群上,FlashMP与主流迭代求解器BiCGSTAB和GMRES结合使用,相比无预处理情况,可将迭代次数减少高达16倍,整体求解速度提升2.5至4.9倍。在1000 GPU规模下,FlashMP仍保持84.1%的并行效率,展现出优异的弱扩展性能。
该研究成果已被IEEE International Conference on Computer Design (ICCD) (CCF B)录用并发表。论文第一作者为高性能计算部博士研究生张浩源,通讯作者为张鉴研究员。本研究得到了中国科学院战略性先导科技专项(XDB0500101)的支持。
相关成果:Zhang H, Gao Y, Zhang X, Li J, Jin R, Chen Y, Zhang F, Yuan W, Ma W, Liang S, Zhang J, Lu Z. FlashMP: A Fast Discrete Transform-Based Solver for Preconditioning Maxwell's Equations on GPUs[C]//Proceedings of the IEEE International Conference on Computer Design (ICCD). 2025.
责任编辑:郎杨琴