IBM刀片出手 天文难题迎"刃"而解

来源:ZDNET至顶网服务器频道  
2011/6/15 11:05:58
ZDNET至顶网服务器频道 6月14日 南京报道(文/孟庆):前不久,记者来到南京大学高性能计算中心采访了负责此项目的周庆林老师,具体了解了南京大学选用IBM HS22刀片服务器的背景故事,并参观了该高性能计算中心机房。这套系统采用IBM HS22刀片服务器打造,于2009年第二季度开始建设,2010年7月份完成全部调试工作正式投入对南京大学各科学院系的高性能计算服务中。在2010年国内高性能计算排行榜Top100上,来自南京大学的高性能计算系统以34万亿次的Linpack成绩排第20名。



本文关键字: IBM 刀片 服务器

ZDNET至顶网服务器频道 6月14日 南京报道(文/孟庆):前不久,记者来到南京大学高性能计算中心采访了负责此项目的周庆林老师,具体了解了南京大学选用IBM HS22刀片服务器的背景故事,并参观了该高性能计算中心机房。这套系统采用IBM HS22刀片服务器打造,于2009年第二季度开始建设,2010年7月份完成全部调试工作正式投入对南京大学各科学院系的高性能计算服务中。在2010年国内高性能计算排行榜Top100上,来自南京大学的高性能计算系统以34万亿次的Linpack成绩排第20名。

1、 南京大学高性能计算中心的建设背景

据周庆林老师介绍,南京大学从事高性能计算方面的建设始于1980年天文系的应用需求。随着科学技术以及教育需求的提升,各个院系也相继开始购买服务器解决自己的计算需求。但是各个院系由于成本、人力等原因自己建设科研教学用高性能计算节点过于浪费,且不符合资源利用最大化的需求。

因此,在985工程二期的项目中,南京大学拨出了专门款项购置和更新全校所需的共享大型计算设备,力求为全校理科院系提供更强大的计算能力。到了2005年左右,x86架构高性能计算集群开始升温,大大动摇了传统共享内存模式的小型机地位。因此,南京大学打算做小规模的小型机,另一部分做x86集群——但是有两个问题:第一是机房选址问题,第二是到底选择什么样的x86服务器。

周庆林老师表示,当时再机房选址时主要考虑了两个方面的问题:1、机房的承重问题,由于每个机架塞满服务器之后有数吨重,建设在高楼层需要对楼层进行加固,因此最终选择了建设在一楼。2、机房的制冷和走线问题,南京大学当时选择了物理系1层做数据中心机房,但是问题在于电力配给不够,考虑到增容需要对楼宇进行改造,因此最后选择在天文系的楼宇建设机房。

机房选址的问题解决之后,究竟选择机架服务器还是刀片服务器做高性能计算中心的计算节点呢?周庆林老师表示,当时专家组也经过了一些讨论,并结合学校有些院系的使用经验,最终选择了刀片服务器。据周老师介绍,刀片服务器至今已经经过了几代的发展,日趋成熟。而机架服务器相对来说存在布线、管理较复杂的问题。

南京大学高性能计算中心从选用IBM HS22刀片服务器以来至今,没有出现过任何计算节点的问题,稳定性方面不弱于机架服务器(甚至更好)。散热方面,目前高端刀片机箱由于计算密度高,计算资源集中,因此只要做好冷热通道就能很好的解决散热效率,满足系统需求(第三节有机房的具体介绍,会着重介绍散热)。

2、 南京大学高性能计算中心架构揭秘

确定了选择刀片服务器之后,通过招标南京大学选择了IBM BladeCenter HS22刀片服务器作为高性能计算系统的计算节点。整个系统由10个登陆节点,4个管理节点,54TB高速并行存储、128TB SAN架构存储以及4x Infiniband全线速网络、千兆作业调度管理网络等构成。

据周老师介绍,全套系统由402片HS22刀片服务器构成,每节点12GB内存,2颗英特尔至强5500系列处理器(主频2.66GHz,8MB Cache),20Gb Infiniband HCA卡。其中有10片HS22刀片服务器用作登陆节点,每节点24GB内存,4Gb光纤卡,20Gb Infiniband以及千兆网卡。另有30台刀片机箱与上述计算节点配套,拥有16口Infiniband交换模块、六口千兆交换机和两个百兆管理网口。

存储和管理方面,南大高性能计算中心选择了20台IBM x3650做存储节点,每节点配置32GB内存,20Gb Inifiniband卡,6块450GB 15000转SAS盘,共54TB组成并行存储系统,连续读写I/O大于每秒6GB。另有一台IBM DS3000 SAN架构官仙共享存储系统共128TB容量容量,配备16GB Cache,两个8口光纤卡,连续读写带宽大于每秒2GB。此外,还有一台x3550用作集群管理监控节点,3台x3650用作管理和作业调度节点。

网络交换方面,周老师介绍说他们采用了两台288口20Gb 4x Infiniband交换机(当时还没有成熟的40Gb Infiniband交换设别),组成全线速无阻塞并行计算网络。此外还有四台4口万兆上行48口BNT的交换机用作作业调度和管理。

对于刀片服务器的散热和供电是重中之重,南大高性能计算中心采用了4台90千瓦制冷量的艾默生LibertPex机房精密空调,120千瓦UPS拥有96节汤式100AH电池,可在断电的情况下维持数据中心1小时时间,足够工作负载暂停和系统正常关闭。此外,南京大学高性能中心还配备了三个配电柜,提供500KVA机房电力增容,一套七氟丙烷气体消防灭火系统为机房提供消防保障。

 

责编:张欢
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918