今天,无论是政府和科研机构里的超级计算机,还是大型互联网公司的分布式服务器集群,抑或是服务亿万公众的云计算数据中心,对计算资源的需求越来越高,用到的服务器数量越来越多。然而,大规模计算系统的应用,却面临有限的机房空间、紧张的电力供应、严格的散热与节能环保要求、繁杂的管理维护工作以及有限的资金预算等多方面的限制。为此,从政府到工业界,从IT厂商到用户机构,大家都在寻找行之有效的解决办法。东京工业大学的苦恼 在全球高性能计算领域,日本东京工业大学算是一位“老兵”了。早在2006年,该校就构建了名为“TSUBAME Grid Cluster”的高性能计算系统,在当年全球高性能计算TOP500排行榜中名列第7位,也是当年亚洲最快的超级计算机。过去四年来,TSUBAME承担了日本工业界和学术界的许多科研项目,而且有一部分计算资源还开放给师生使用,因此也被誉为“大家的超级计算机”。 进入2010年,TSUBAME面临升级。而且,此番东京工业大学的目标是构建日本第一套世界顶级的超级计算系统:2.4千万亿次(PFlops)的TSUBAME 2.0!根据2010年6月公布的TOP500排行榜,排名第一的是安装在美国橡树岭国家实验室的CRAY Jaguar系统,Linpack测试能是每秒1.75 千万亿次。 不过,要构建这样一套超大规模的计算系统,东京工业大学至少要克服三大挑战: 首先是空间有限。安装TSUBAME 2.0的机房面积只有200平方米,要知道2009年中国最快超级计算机“天河一号”由103个机柜组成,性能1.206PFlops,占地面积达到近千平方米!可见TSUBAME 2.0对单位机器的计算密度要求相当之高。 其次是电力有限。数据中心供电功率为1.8 MW(1兆瓦=1000000W),比较而言,当前全球最快的超级计算机CRAY Jaguar功耗大约是7MW,今年中国最快的超级计算机曙光“星云”也要2.55MW。因此,对TSUBAME 2.0来说,必须尽可能地提高每瓦特电能所产生的计算性能,即能效比。 第三是资金有限。预计搭建TSUBAME 2.0和未来四年运行费用合计在32亿日元以下(按1日元 = 0.0814元人民币折算,即2.6亿元人民币)。试想一下,如果使用普通的x86服务器作集群计算节点,仅搭建成本就可能超过这一预算,而且如此大规模系统的运行电费和管理费用也都是一笔不小的开支。HP ProLiant SL390s G7大显身手 显然,要构建上述系统,依靠传统的技术方法是行不通的,必须采用新技术。实际上,东京工业大学在TSUBAME 2.0中采用了许多最先进的技术,包括最新的英特尔®处理器技术,SSD固态存储技术,GPGPU异构并行协处理技术、最新的Infiniband和万兆以太网连接技术、超可扩展模块化服务器节点技术等,以尽可能地提高系统的计算性能、计算密度和能源效率。作为TSUBAME 2.0系统的主体,1400多台计算节点采用的是HP ProLiant SL390s G7超可扩展系统。 HP ProLiant SL390s G7(插入机箱为HP ProLiant s6500)高密度GPU计算 HP ProLiant SL390s G7有两种机型,虽然宽度都只有标准19英寸机架服务器的一半,但在高度上有1U和2U之分。其中,1U半宽的版本主要针对通用高密度计算,在相配套的4U高HP ProLiant s6500机箱里可以装入8个这样的双路服务器节点,即每U空间的计算密度增加一倍,甚至比当前主流的10U16刀片服务器系统的密度还要高。而2U半宽的版本则专门针对需要GPU进行协处理的用户,如科学计算模拟,不仅支持两颗CPU,还支持3块最新的NVIDIA Fermi GPU处理器,从而实现CPU+GPU的异构并行协同计算。 作为当前最主流的高性能计算加速技术,GPU的使用能数十倍、数百倍地提升系统计算效率,而且,在相同计算规模下,其硬件成本只是传统CPU服务器机群的十分之一左右,同时能耗和占地空间可以节省90%以上。因此,对于希望在有限空间和电力条件下构建超千万亿次计算系统的东京工业大学来说,GPU计算无疑是一条最有效的途径。 TSUBAME 2.0使用了1400多台HP SL390s G7作为计算节点,每个节点可搭载两颗英特尔®六核至强® 5600 2.93GHz处理器(通过英特尔® TurboBoost技术可将频率进一步提高至3.196GHz)以及3块NVIDIA Tesla M2050 GPU(基于Fermi架构),合计包含12个CPU核心以及1344个GPU核心(通用计算单元)。总体计算下来,TSUBAME 2.0总共拥有17664个CPU内核和189万个GPU内核,总运算能力达到2391.35TFLOPS,其中超过90%的计算能力来自GPU,使其成为全球首台以GPU为主要运算能力来源的顶级超级计算机。节能 跟普通机架服务器使用独立电源和风扇的设计不同,HP ProLiant SL系列在同一个机箱里由多台服务器节点共享电源和风扇,从而大大提高电源和散热系统的使用效率,并使得整机在重量上更轻,成本更低。 另外值得一提的是,为了减少电源在将交流电转换成直流电过程中的损耗,HP SL390s G7使用了效率高达94%的电源,远远超过能源之星指定的80%电源效率级别。而且,进一步借助HP ProLiant SL Advanced Power Manager和HP Intelligent Power Discovery软件,可以大大提高电源管理效率。 正是通过共享高效率电源、数据中心液冷散热系统等节能技术的应用,TSUBAME 2.0的能效比达到了其第一代系统的30倍!高效管理 对于HPC等高密度计算环境而言,由于服务器数量较多,往往会导致系统管理变得异常复杂,比如在服务器安装、配置、维护时,如果没有合适的管理工具,IT管理员的工作效率会大打折扣。作为HP 300系列的一款服务器,SL390s G7拥有了许多比100系列更高级的特性,如iLO3、SIM、SmartStart等。其中集成的HP Integrated Lights-Out 3 (iLO)使得管理员无须借助其他额外软件,仅通过Web浏览器就可以从远程访问服务器,简化服务器设置,进行状态监控,电源和散热控制。SL390s G7还采用I/O前置的人性化设计,将iLO 3、千兆以太网、万兆以太网、Infiniband、PCI-E、串口、VGA、USB等接口统一设计在前面板,这样使得管理员在数据中心机柜前就可以布线和管理维护,而无须跑到机柜后面去。 当然,HP也提供了一系列更高级的管理软件供用户选择,比如HP Insight Control、HP Insight Dynamics for ProLiant,可以对整个IT基础架构进行更高效的管理,包括远程控制、IT架构优化、能源优化管理、物理和虚拟资源管理、负载均衡、灾难恢复等。另外,针对高性能计算用户,HP也提供了一系列集群管理组件,如HP Cluster Platforms、HP Cluster Management Utility、HP HPC Linux Value Pack等,方便用户对大规模集中进行资源配置、管理、监控以及作业负载管理。高密度计算的新宠 其实,东京工业大学碰到的是很有普遍意义的问题。除了HPC,高密度计算的适用领域非常广泛,如横向扩展(Scale-out)、Web2.0、云计算等数据中心都提出了类似的需求。如何在空间、电力、散热有限的条件下,用一种较低的成本来实现大规模服务器系统的扩展,已经成为业界的焦点话题。 实际上,HP公司这两年一直在不断拓展其创新的HP ProLiant SL可扩展系统产品线,以满足更多不同用户的需求。在2009年6月份推出了SL6000s系列,支持3种英特尔®至强®处理器的半宽服务器——SL160z、SL170z和SL2x170z。2010年HP再度出击,推出了最新的SL6500系列,支持最新的SL170s和SL390s G7。 总之,作为一种新型通用系统平台,HP ProLiant SL可以灵活地支持多种应用服务,包括在石油、气象、海洋、地震、测绘、生物医疗、军队的应用。同时,还可支持社交网络、互动媒体、网络游戏、科学计算、图像渲染、建模模拟等。正是得益于“密度比普通机架服务器高,成本比刀片服务器低,模块化灵活扩展,方便管理和绿色节能”等优势特性,使其受到了越来越多用户的青睐。