超级计算机又称超算,HPC,高性能计算等。 相比于手机、互联网、云计算等行业,高性能计算是一个十分冷门的行业,除非专业人士,否则很少有人能关注到,不时远离公众视野,不为人知。 但近几年,随着科技对国度战略的越来越重要,高性能计算开端出往常各种媒体,被逐步注重起来。 为什么要做高性能计算? 人类对计算及性能的请求是无止境的,有了高性能计算,对科研工程、模仿仿真等范畴的展开会起到十分好的促进作用。 今天就和大家来聊聊高性能计算的展开历史。 上世纪七十年代,美国克雷机开启了高性能计算的大幕。超级计算机一经推出就大受追捧,先后被美国能源部、国防部、波音、美孚石油采购。 往常大家对高性能计算大致分为这样四个阶段:向量机、SMP、MPP、集群。 八十年代,我国也推出了自己的向量机:银河1号,用来计算核爆、流膂力学、石油开采等一些亟待处置又高度失密的课题。往常银河1号向量机曾经退役。 向量机固然计算性能强大,但缺陷也十分明显,就是一切软硬件都需求特地设计定制,与市场上大量销售的软硬件不兼容,这使得向量机的价钱十分昂贵,很难做到提高。 这个缺陷严重限制了向量机的展开。所以当时人们为了降低向量机的成本,把目的转向通用的软硬件设备,于是SMP就此降生。 SMP能够翻译为”对称多处置”。它是在计算机里装置多块处置器,共享内存和数据总线来进步计算性能。就像往常的手机、平板、PC运用的多核CPU其实也是SMP架构,区别是以前的处置器会装置在主板的多个基座上,由总线衔接;往常是把多块处置器在消费时就封装到一同,插在一个基座上。 SMP技术难度低、计算才干提升明显、性价比高、市场需求大,能够兼容当时大多数软件,一经推出,就遭到了众多厂商的跟风,当年Compaq、HP、IBM一众行业大佬,都是消费SMP效劳器的主力军。 但SMP架构也有自己的缺陷和限制,它需求共享内存和数据总线,运转过程中存在物理资源竞用的问题,这就限制了性能发挥,经过增加的处置器数量来增加性能的方式让其扩展性十分有限,也限制了SMP架构的展开。后来人们为了追求更强大的计算才干,便推出MPP架构。 MPP称为”大范围并行处置”。这种架构取消了共享内存和数据总线,把每台计算机做一个独立的节点单元来看待,节点之间用专用的高速网络衔接,经过软件协同完成共同的任务,属于地道的无共享架构(ShareNothing)。 MPP架构相比SMP架构,性能固然有了大幅提升,但是缺陷也更多,好比对硬件设备请求高,产品价钱贵,扩展才干缺乏,需求特地的软件来支持(开发MPP软件是远比MPP硬件更复杂的事)。所以它依旧是那些不在乎成本的IT巨头和垄断部门的专属玩物。实践这些年来,MPP之所以没有展开,这些限制缺陷是主要缘由。 于是,为了取得更强大的计算效果,高性能计算来到了第四个阶段:集群。 往常的计算机集群可说是这些年IT新技术展开的综合体和集大成者。除了继续沿用MPP节点的概念,还大量自创采用互联网衍生出来的各种基础技术。好比普遍采用通用硬件来降低设计和采购成本;采取“软件定义硬件”战略,把原本属于硬件的功用转移到软件来处置,而且还便于升级。 运用统一的协议支持异构计算平台,允许动态增加减少计算节点,经过”硬件冗余+软件容错“处置硬件运转过程中呈现的问题。所以往常计算机集群即完成了超强的扩展才干,又能够保障足够的经济性。 另外,与前几次主要面向专业范畴不同,当前集群的展开方向曾经转向了商用范畴,这是十分宽广的市场,有着庞大的商业利益。例如在军事方面,在天气预测,在科研方面,在模仿仿真设计方面,在能源开发等方面,高性能计算越来越多的应用在商业范畴。 由于面向商业用户,更多强调经济性和运用成本,运用虚拟化技术支持多租户共享,普遍采用按时付费的支付方式,能够依据用户需求分配云端资源。 集群架构另一个主要范畴是超级计算机,当前世界上主要的超级计算机,好比我国的“神威”、“天河3”,美国的“泰坦”、“Summit”,日本的“京”,都属于集群架构。而且云计算和超级计算机也正在融合中,往常一种叫“超算云”的共享计算方式正在各大云平台中构成。 说完硬件,再说软件。由于树立在集群架构之上的业务需求、市场生态曾经发作了基本变更,基于早期几种架构研发的软件很难发挥出集群的性能。目前往常有几家ICT巨头看好集群业务带来的商机,正在投入巨资研发通用的集群系统软件,希望一举拿下这个蓝海市场。 这有点象移动互联网刚刚开端的时分,苹果推出IPhone手机后,需求再推出iOS操作系统来适配IPhone手机。另外在超算范畴,超级计算机做为国度综合科技实力的细致表示,与各国基础科研密切相关,将带动一大批产业展开,也都在加大对超算和超算软件的研发投入。所以往常无论是企业还是政府,都是一副百舸争流的状态,希望经过集群操作系统进一步稳定各自的优势位置,拿到下一场技术反动的门票。 最后,一个不争的事实是,目前无论云计算、超算,还是集群软件,依旧是美国最强,我国处于追逐位置。 由于集群硬件基本构型曾经完成,往常各国发力竞争的主要是集群软件,特别是集群操作系统这样的通用基础软件。美国曾经经过PC操作系统、手机操作系统取得在个人电脑、手机范畴的决对优势,稳定了全球指导位置,进而影响全世界,直到往常。往常集群操作系统相似于当年iOS退场的时分,集群操作系统将决议我国未来二三十年在云计算、大数据、人工智能的生态市场和指导位置。 关于中国,这是一场不能输的战争。而且由于近几年我过高性能计算的展开,曾经惹起了美国方面的注重,针对高性能计算范畴的封锁越来越严。 目前,前方道路依然漫长,需求我们一同凝聚力气去完成高性能计算的展开! |