石油学报 ›› 2014, Vol. 35 ›› Issue (4): 700-705.DOI: 10.7623/syxb201404010

• 地质勘探 • 上一篇    下一篇

Kirchhoff叠前时间偏移的GPU移植与性能优化技术

马召贵1,2, 赵改善1, 武港山2, 岳承琪1, 何恺1, 王鹏1   

  1. 1. 中国石油化工股份有限公司石油物探技术研究院 江苏南京 211103;
    2. 南京大学软件新技术国家重点实验室 江苏南京 210093
  • 收稿日期:2014-01-17 修回日期:2014-04-15 出版日期:2014-07-25 发布日期:2014-08-05
  • 通讯作者: 马召贵,男,1978年12月生,2003年获石油大学(北京)学士学位,2010年获中国石油大学(北京)博士学位,现为中国石油化工股份有限公司石油物探技术研究院高级工程师,主要从事地震偏移成像方法研究与软件研发工作。Email:mazhg.swty@sinopec.com
  • 作者简介:马召贵,男,1978年12月生,2003年获石油大学(北京)学士学位,2010年获中国石油大学(北京)博士学位,现为中国石油化工股份有限公司石油物探技术研究院高级工程师,主要从事地震偏移成像方法研究与软件研发工作。Email:mazhg.swty@sinopec.com
  • 基金资助:

    国家高技术研究发展计划(863)项目(2009AA01A140)资助。

GPU-based porting and optimization of Kirchhoff pre-stack time migration

Ma Zhaogui1,2, Zhao Gaishan1, Wu Gangshan2, Yue Chengqi1, He Kai1, Wang Peng1   

  1. 1. Sinopec Geophysical Research Institute, Jiangsu Nanjing 211103, China;
    2. State Key Laboratory for Novel Software Technology, Nanjing University, Jiangsu Nanjing 210093, China
  • Received:2014-01-17 Revised:2014-04-15 Online:2014-07-25 Published:2014-08-05

摘要:

叠前时间偏移在工业生产中发挥着极其重要的作用,为了提高该算法的计算效率,开展了基于GPU异构计算平台的算法移植与优化。首先根据积分法偏移的算法特点制定了偏移距域的多进程数据域并行以及IO与计算异步并行总体并行策略;然后为了提高偏移核心计算部分在GPU上的计算效率,对偏移计算核在GPU上的并行方案进行了分析,选择了成像域超大规模线程并行方案对算法进行了移植和优化,并对不同优化手段在不同GPU硬件平台下获得的性能加速进行了对比测试;最后利用大规模计算节点及大规模地震数据体进行了移植后算法的应用测试,并对算法的计算效率、可扩展性以及精度误差进行了分析。大规模应用测试表明,积分法叠前时间偏移经过GPU移植后可获得较CPU平台近7倍的性能提升,具有很好的工业应用价值。

关键词: 叠前时间偏移, 高性能计算, 并行效率, GPU移植, CUDA优化

Abstract:

Pre-stack time migration (PSTM) plays an important role in industrial production. To improve its computation efficiency, algorithm porting and optimization are performed based on the GPU heterogeneous computing platform. According to the characteristics of the Kirchhoff algorithm, a parallel strategy is initially designed with the multi-processes parallelism in common offset domain and the asynchronous parallelism of IO and computing. For improving the computation efficiency of migration kernel on GPU, this paper then analyzes the parallel strategy on GPU of migration kernel, performs algorithm porting and optimization with massive scale threads in imaging domain, and assesses the performance of different optimization methods for various GPU hardware platforms. Finally, the algorithm testing is carried out with large-scale computing nodes and seismic data followed by an analysis of computation efficiency, scalability, and precision error of the algorithm. Large-scale application test results show that after GPU porting, the performance of Kirchhoff pre-stack time migration is improved by nearly 7-fold compared with the CPU platform, thus having great value for industrial applications.

Key words: pre-stack time migration, high performance computing, parallel efficiency, GPU porting, CUDA optimization

中图分类号: