欢迎user
背景需求
位于南京的中国石化物探院是中国石化石油物探技术发展的参谋部,物探高新技术和核心技术研发中心,物探专业软件研发及推广中心,重大物探工程技术支持中心。石油物探技术研究院的前身为物探技术研究所,该单位成立三十多年来,主持承担和完成了三百多项国家重点科技攻关项目,取得了大量高水平的实用科研成果,在三维地震、高精度地震、井中地震等勘探方法上,以及基础理论研究、勘探工程规划、数据处理分析、复杂构造成像等物探关键技术领域,形成了一系列特色技术和专有软件产品。
客户需求
作为中国石化旗下的找油先锋,中国石化物探院从2000年起就开始部署用于处理三维叠前深度偏移的计算机系统,并为其先后部署过多批服务器CPU集群,以搭建高性能计算系统。随着计算机技术的发展和三维叠前深度偏移计算方需求的增加,借助物探院在南京江宁区新基地的建设,物探院在中国石化总部的支持下决定对集群系统进行全面扩充,以满足对三维叠前深度偏移的高性能计算要求。
解决方案
中国石化物探院根据三维叠前深度偏移系统高性能计算平台的应用现状以及未来的发展需要,在与合作伙伴新华三经过仔细的沟通和挑选后,确定采用刀片集成万兆网络解决方案,先后三期采购了共计688节点B5600(ProLiant BL460c G7)刀片服务器、272节点H3C B5600(ProLiant BL460c G8)刀片服务器以及配套的6120XG刀片式万兆交换机,作为高性能计算的处理器平台。同时,还部署了H3C R4800(ProLiant DL380)服务器、R6800(ProLiant DL580)服务器和SL390 GPU服务器,分别作为任务分发、作业调度、存储I/O、管理系统、GPU测试开发应用服务器。在选型的过程中,中国石化物探院对千兆网、IB网和万兆网等网络解决方案进行了仔细调研,通过调研认为IB网络方案架构的设计难于在短期内将现有的程序代码并进行大量的修改而立即用于生产,千兆网络则因为计算速度太慢且时延高,系统的网络带宽面临瓶颈,不利于系统的未来升级扩容。万兆网络解决方案,既保证了整个系统的网络高带宽和低时延,又允许用户不用修改其程序,只需平移原程序便能实现在新系统上的运行。中国石化物探院信息中心在多年的系统运行过程中也注意到,单靠处理器快速发展已经满足不了石行业的HPC需求,尤其是石油行业RTM(逆时偏移)应用渐成主流,数据处理量和I/O需求急剧增加,RTM算法的采样率提高1倍,就会带来16倍的计算强度和8倍的内存访问量。此时,性价比很高的万兆网络是一个很好的切入点。
刀片万兆网络技术对中国石化物探院来讲是一次全新的尝试,为了保证项目的顺利实施,首先进行技术调研工作,与业内多位技术专家共同探讨交流上马万兆网络的可行性、实施技术难点与经验。确定方案后,采用刀片集成万兆网络解决方案搭建了一套完整的三维叠前深度偏移高性能计算系统原型测试环境。整个测试过程中系统平稳运行,测试结果在性能上验证了此方案的可行性。
客户价值
刀片万兆网络技术的实施是中国石化物探院信息化建设的一次具有战略意义的决策。因为刀片集成万兆网络解决方案设计具有前瞻性,在实施和运行过程中充分证明该方案的确经得起考验,高效和稳定的运行环境极大地提升了中国石化物探院三维叠前深度偏移系统的计算能力。
除了性能强大、运行稳定外,由几百个节点构成的高性能计算集群还面临着高能耗、管理复杂、可扩展性等诸多挑战。新华三的刀片服务器在很多功能和细节设计上解决了这些问题。比如ProLiant BL460c在产品设计,像刀片风扇相比机架服务器冷却所需气流降低50%,耗电降低70%,在供电成本上更具有优势;而集成管理模块iLO,允许IT人员在任何时间、任何地点实现服务器管理,降低了管理难度和成本。刀片服务器具备集成的iLO-2管理、扩展的内存和I/O。此外,ProLiant BL460c可以通过镜像内存、联机备用内存、内存交叉存取、嵌入式RAID功能来提高密集型平台的容错功能。
随着中国石化物探院对利用新华三方案搭建的HPC环境逐渐熟悉,物探院开始将关注重点从单纯的计算需求转向更高的要求,比如提高CPU/GPU利用率(MPI环境管理软件)、提高存储性能(大容量,性价比高的并行存储系统)、确保数据安全(备份和容灾)以及合理控制能耗(绿色节能低碳)等方面,而上述这些需求恰恰也都是刀片产品较具竞争力的地方,所以中国石化物探院决定在今后的系统升级扩容时依然沿用刀片万兆网络技术规划设计架构。