面向国产神威众核架构的区域气候模式CWRF性能优化技术
2022年电子技术应用第1期
吕小敬1,2,刘 钊2,3,蔡蕙伊2,李锦薇2
1.中国船舶科学研究中心,江苏 无锡214000;2.国家超级计算无锡中心,江苏 无锡214000; 3.清华大学,北京100084
摘要:区域气候模式CWRF(Climate-Weather Research and Forecasting model)是国家气候中心区域气候预测系统的重要组成部分,也是系统最耗时的程序。高性能计算是提高CWRF数值预报计算性能的关键技术,开展CWRF模式在国产神威众核架构上的移植和优化,提高模式的模拟效率,对模式的扩展、开发能力和可持续发展具有重要意义。基于国产众核SW26010处理器,完成了CWRF区域气候模式的移植、性能分析和深入性能优化,采用访存优化、Cache命中率优化及众核加速优化等方法,对CWRF模式动力过程、物理过程和I/O过程计算代码进行重构及众核加速。结果表明:优化技术可使CWRF动力过程平均加速2倍,最高加速6.4倍,物理过程平均加速1.7倍,最高加速5.4倍,I/O过程加速1.2倍,程序整体最高加速1.4倍,计算误差在合理范围内。
中图分类号:TP391
文献标识码:A
DOI:10.16157/j.issn.0258-7998.212397
中文引用格式:吕小敬,刘钊,蔡蕙伊,等. 面向国产神威众核架构的区域气候模式CWRF性能优化技术[J].电子技术应用,2022,48(1):31-38.
英文引用格式:Lv Xiaojing,Liu Zhao,Cai Huiyi,et al. Optimization technology for regional climate model-CWRF based on domestic Sunway many-core architecture[J]. Application of Electronic Technique,2022,48(1):31-38.
文献标识码:A
DOI:10.16157/j.issn.0258-7998.212397
中文引用格式:吕小敬,刘钊,蔡蕙伊,等. 面向国产神威众核架构的区域气候模式CWRF性能优化技术[J].电子技术应用,2022,48(1):31-38.
英文引用格式:Lv Xiaojing,Liu Zhao,Cai Huiyi,et al. Optimization technology for regional climate model-CWRF based on domestic Sunway many-core architecture[J]. Application of Electronic Technique,2022,48(1):31-38.
Optimization technology for regional climate model-CWRF based on domestic Sunway many-core architecture
Lv Xiaojing1,2,Liu Zhao2,3,Cai Huiyi2,Li Jinwei2
1.China Ship Scientific Research Center,Wuxi 214000,China; 2.National Supercomputing Center in Wuxi,Wuxi 214000,China;3.Tsinghua University,Beijing 100080,China
Abstract:CWRF(Climate-Weather Research and Forecasting model) is a component of the regional climate prediction system built in the National Climate Center, and consumes the largest proportion of time. High performance computing is a key technology used to improve the compactional performance of CWRF. Carrying out the configuration and optimization of the CWRF model based on the domestic Sunway many-core system, improving the simulation efficiency are of great significance for the speedup, as well as the development capability and sustainable development of the model. This paper completed the configuration and performance evaluation of CWRF based on the SW26010 many-core architecture. Memory access optimization, Cache hit rate optimization, many-core acceleration models are introduced to speedup CWRF relating to the dynamic-core process, physical process and I/O process. The results show that the average speed of the dynamic process is 2 times and the highest speed is 6.4 times, the average speed of the physical process is 1.7 times and the highest speed is 5.4 times, the I/O process speeds up 1.2 times, the overall program speeds up to 1.4 times, and the calculation error is reasonable.
Key words :CWRF;high performance computing;Sunway;SW26010
0 引言
随着社会经济技术的快速发展,人民生活水平不断提高,国家和社会对短期气候预测精准度的需求越来越高。我国地处东亚季风区,受全球变暖的影响,灾害性极端气候事件日益频发,对我国经济生产和人民生活造成了严重影响,因此高质量的中短期天气预报,季节内-季节-年代际尺度的气候预测和预估,对于减灾防灾,促进我国国民经济持续增长和社会发展有重要而迫切的意义[1-2]。
数值预报预测是提升气候模式预测能力的核心技术,数值预报预测的研究依赖于高性能计算设备[3-4],大的气候气象中心都拥有自己的高性能计算设备专门用于气象气候方面的研究,如美国NCAR(美国国家大气科学研究中心)[5]、ORNL(美国橡树岭国产实验室)[6]、德国DKRZ(气候计算研究中心)[7]等。同时世界各地很多超级计算机系统都部署了气候气象数值预报应用,如意大利投入并使用超级计算机用于支持高分辨率气象气候建模[8],英国拥有国家超级计算机Cray XC40系统,并用于气象学、气候变化等的研究[9]。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003905。
作者信息:
吕小敬1,2,刘 钊2,3,蔡蕙伊2,李锦薇2
(1.中国船舶科学研究中心,江苏 无锡214000;2.国家超级计算无锡中心,江苏 无锡214000;
3.清华大学,北京100084)
此内容为AET网站原创,未经授权禁止转载。