【賽迪網訊】Top500的第31期已經發佈一段時日了,想必大家針對本次TOP500排行榜有了一定的認識。IBM的走鵑超級電腦憑藉超過千萬億次的運算能力,榮登本次排行榜的桂冠。通過本次高性能計算榜單的發佈,我們從中總結了諸多高性能運算發展的趨勢,比如高運算能力、能效至上等,但我們也從中發現我國完全自主的超級電腦並沒有上榜。
事實上曙光自主創新的新一代高性能超級電腦曙光5000A憑藉Linpack值達到160萬億次的運算能力,完全可以進入榜單,而且可以取得第七名的優異成績,但因為某些原因而遺憾落榜,不得不說是本次榜單中最大的遺憾。但曙光卻認為這個遺憾並不“遺憾”,正如曙光公司副總裁聶華先生所言:“但基於對用戶負責的原因,但是正是由於這個排名,我們要看到對用戶實際應用的效果”。
近日,曙光牽手AMD公司以及30余家IT媒體和行業媒體在文津國際酒店共同舉辦了曙光5000A高效能電腦研討會。通過一種面對面零距離的溝通方式,向在座的各家媒體記者講述了來自曙光5000A自己的故事。
●完全全自主創新:就像是從黑暗中摸索一樣,坎坷的經歷,不屑的努力,成就曙光迎來了“曙光”——曙光5000A發佈會主持人
記得在曙光5000A的發佈會上,小小的停電事故成就了主持人一番慷慨演講。的確,在伺服器產品同質化現象嚴重的今天,只有堅持自主創新才能形成產品差異化,才能構建競爭優勢。而且,經濟實力強勁的西方國家一直對高性能電腦的核心技術擁有掌控權,也將高性能電腦作為戰略物資對外封鎖。以中國為首的發展中國家,只有走自主研發的道路,不斷開發自己的高性能計算產品,才能使自己不至於淪為西方國家低性能計算產品的高價傾銷地。
儘管曙光5000A在運算能力上從上一代曙光4000A的十萬億次突破達到百萬億次,但在研發百萬億次的過程中所面臨的技術瓶頸更是成倍增長,決不是簡單的數字的疊加。從體系結構、處理器、互聯晶片到組裝工藝,從性能提升到環保綠色都有重大創新。
曙光5000A超級電腦的完全自主創新包括主板,體系結構,刀片伺服器,刀片機箱系統,網路交換系統,水冷散熱系統在內的全部系統。例如首次實現了4路16核的高密度刀片系統;首次實現了單刀片機箱40顆CPU的高密度機箱設計;首次實現了基於DDR的Infiniband的交換結構,實現了20GB高速互聯和小于1.3us的低延遲;首次採用了水冷散熱系統,降低了高性能電腦對機房系統的要求,降低了系統功耗。這些“首次”的創新設計看起來簡單,但實際上都是曙光研發人員凝結的心血。
從曙光針對5000A的宣傳中,我們經常會看到一個比較陌生的詞彙——HPP體系架構。其實目前高性能電腦主流體系系統並沒有HPP這個提法,而是有MPP,有MSP等等,曙光把5000體系結構叫HPP,主要它在體系結構上結合了機群體系結構和MPP體系結構兩類結構的優點。它主流的結構是機群,結點機是四路四核的,所以在機群應用角度來說既能夠用很大的機群,同時還能覆蓋一大塊基於UMA架構的,兩個結合起來起一個名字叫HPP。
作為一台超級電腦系統,計算單元稱得上該系統的核心部分,而整個計算系統的核心當屬基於刀片伺服器架構的超並行處理系統。曙光致力於開創全新的刀片系統設計,該刀片系統採用7U架構,每個刀片機櫃最多支援10片計算刀片。每個刀片計成40個四核AMD皓龍處理器,最高可擁有160核心的高密度設計,是常見1U機架伺服器密度的2.86倍,處在刀片行業的先列。同時全自主設計配套模組,遵照中國刀片伺服器標準,對結構性的提升、可靠性的提升以及對網路和管理的冗余配置,給客戶的使用提供了更大的空間。
在計算單元系統中,不得不談到胖節點設計。眾所週知,高性能計算在進行浮點運算處理的過程中,尤其是需要大量浮點運算時,就會需要包含多處理器的伺服器,以完成大規模的計算量。這也就是經常所說的胖節點,胖節點架構有利於性能的提高,因為它採用一種進程/線程間通訊,即胖節點採用CPU間通訊方式,系統將任務隊列對稱地分佈于多個CPU之上,從而極大地提高了整個系統的數據處理能力。而其他架構則採用節點間網路通訊的方式,眾所週知並行程式運算的瓶頸在於通訊,過大的通訊延遲將影響運算速度,而胖節點很好的遮罩了這一點,極大的提高了性能。另外胖節點架構提過對大記憶體支援,節點中任何一個CPU都可以使用節點內全部的記憶體,在運行串列程式時,這個程式可以申請很大的記憶體。同時提供多線程的支援,一個節點中採用多個CPU,這些CPU之間可以進行多線程的並行。
曙光5000A每一處創新的結合最終成就了曙光5000A“四高兩低”的特點,這些優勢並非一種文字上的誇大宣傳,而是給最用用戶帶來的一種實實在在的益處。正如先前對曙光行業總監任京旸對筆者所說的那樣:“四高兩低不是說純技術上的優點,每一高每一低都能轉化成用戶實實在在受益的地方。從廣大用戶來講,大家對高性能計算的需求是無止境的,他會受到客觀條件的限制,主觀上是需要計算能力越強越好。而且對計算能力的需求是爆炸式的增長,但是有一些客觀因素限制,曙光5000A四高兩低主要是解決實際應用中的一些困擾。”
1
2
下一頁>>