北京2023年9月15日 /美通社/ -- 精益求精的設(shè)計理念最早起源于建筑學(xué),它要求設(shè)計師在建筑結(jié)構(gòu)荷載上充分考慮極限設(shè)計下的結(jié)構(gòu)功能,強(qiáng)調(diào)建筑結(jié)構(gòu)需滿足安全性、可靠性、耐久性。如今,這種設(shè)計理念也融匯到各行各業(yè),其中科技行業(yè)更是典型代表,服務(wù)器產(chǎn)品的設(shè)計更不例外。
對于服務(wù)器來說,可以從三個方面來看:首先,在產(chǎn)品設(shè)計時,結(jié)合不同的應(yīng)用場景設(shè)計不同形態(tài)的產(chǎn)品來滿足業(yè)務(wù)需求;其次,在部件選型上,要考慮如何發(fā)揮性能和品質(zhì)保障;最后,對產(chǎn)品結(jié)構(gòu)、部件進(jìn)行優(yōu)化,在滿足期望性能的前提下,加強(qiáng)產(chǎn)品的易用性和可靠性。
浪潮信息今年發(fā)布的全新G7算力平臺,正是秉承了精益求精的設(shè)計理念,采用最先進(jìn)的計算、存儲和互聯(lián)技術(shù),實現(xiàn)全場景覆蓋,提供了從器件、整機(jī)到數(shù)據(jù)中心的全尺度智能化管理。
更佳性能 源自以系統(tǒng)為核心
建筑大師張開濟(jì)曾說過:"建筑設(shè)計不能只顧自己的一個設(shè)計,而要和整個城市的風(fēng)格相和諧"。以整體為核心的設(shè)計,才是筑基經(jīng)典的開始…而服務(wù)器作為數(shù)據(jù)中心中承載著數(shù)據(jù)處理的算力平臺,需要以全局視角來進(jìn)行產(chǎn)品設(shè)計才是發(fā)揮出極限性能,包括解決架構(gòu)設(shè)計、核心部件、高速互聯(lián)、散熱設(shè)計等一系列問題。
浪潮信息G7算力平臺堅持以系統(tǒng)為核心,從電路級、部件級、固件級、系統(tǒng)級進(jìn)行了大量的創(chuàng)新工作。以一臺通用服務(wù)器的研發(fā)為例,整個系統(tǒng)需要經(jīng)過30多個開發(fā)流程,使用150多種加工制造工藝,對280多個關(guān)鍵過程控制點的質(zhì)量進(jìn)行嚴(yán)格把控,并且還要實現(xiàn)與軟件和應(yīng)用的優(yōu)化和適配等問題。
系統(tǒng)設(shè)計的開端是保障供電,G7算力平臺擁有極限供電能力,采用第三代半導(dǎo)體碳化硅及氮化鎵開關(guān)元件,電源功率密度提升至100W/in³,在占比最高的20%~50%電源負(fù)載時,自動識別調(diào)適轉(zhuǎn)化率可達(dá)94%,提升4%~6%的轉(zhuǎn)換效率。
擁有強(qiáng)大動源后,影響產(chǎn)品性能的關(guān)鍵因素是整機(jī)散熱能力,G7算力平臺提供多種散熱方案,傳統(tǒng)風(fēng)冷模式從風(fēng)扇結(jié)構(gòu)、熱流導(dǎo)風(fēng)技術(shù)、智能風(fēng)扇調(diào)控技術(shù)、EVAC散熱技術(shù)、整機(jī)架構(gòu)等進(jìn)行優(yōu)化,通過復(fù)合型散熱調(diào)控,破解風(fēng)源、風(fēng)流場和高功耗部件難題,整機(jī)散熱效率提升24%以上,單臺設(shè)備一年可以節(jié)電近千度。面對PUE更嚴(yán)苛的需求,G7算力平臺支持冷板式液冷、浸沒式液冷等創(chuàng)新技術(shù),其中冷板式液冷覆蓋包括CPU、內(nèi)存等高功耗部件,液冷覆蓋部件的功耗占比70%以上,可幫助數(shù)據(jù)中心的PUE下降到1.1以下。
在內(nèi)存優(yōu)化方面,G7算力平臺的存儲模塊E3.S可通過CXL實現(xiàn)遠(yuǎn)端內(nèi)存擴(kuò)展,延時性能基本與跨處理器內(nèi)存訪問延時相當(dāng),滿足云計算虛擬化場景內(nèi)存擴(kuò)展不足問題。在網(wǎng)絡(luò)互聯(lián)方面,G7算力平臺支持Multi-Host網(wǎng)卡,不僅可以使多個CPU同時連接單張網(wǎng)卡,實現(xiàn)多CPU網(wǎng)絡(luò)IO Balance,減少跨CPU訪問延遲,同時支持多系統(tǒng)之間的互聯(lián),多個計算、存儲節(jié)點可以通過單一的網(wǎng)卡和外界互連,數(shù)據(jù)中心性能可提升150%以上。
正是由于有了以上設(shè)計,G7服務(wù)器在最新的評測中摘下SPEC CPU、SPEC jbb雙路、四路性能冠軍,實現(xiàn)了不同處理器平臺、不同類型產(chǎn)品性能的全面升級,成為多元計算力平臺的性能標(biāo)桿。
場景化設(shè)計 打造最強(qiáng)產(chǎn)品組合
建筑的本質(zhì)是服務(wù)于功能,歌劇院和寫字樓的應(yīng)用場景不同,呈現(xiàn)的建筑形態(tài)也截然不同,數(shù)據(jù)中心的建設(shè)也是一樣,不同用戶數(shù)據(jù)中心的建設(shè)面對著不同的挑戰(zhàn),比如機(jī)房空間不足、數(shù)據(jù)量爆炸式增長、運(yùn)維人員資源不足、擴(kuò)容需求周期緊張等。面對不同的業(yè)務(wù)場景需求,G7算力平臺從計算密度、存儲密度、IO擴(kuò)展等多個方面進(jìn)行優(yōu)化。
例如,大數(shù)據(jù)技術(shù)的發(fā)展讓數(shù)據(jù)中心用戶開始面對分布式緩存、熱存儲等差異化的存儲場景,對服務(wù)器計算性能、存儲密度以及IO有不同需求。
為此,浪潮信息推出了針對存儲優(yōu)化型產(chǎn)品——NF5266G7,可應(yīng)對計算性能、存儲密度不斷提升,IO擴(kuò)展等多方面的壓力,在2U空間能支持2顆最新處理器,同時提供最大600TB和上百種存儲配置方案,讓大數(shù)據(jù)應(yīng)用在CPU投資減少50%;而面對計算密集型場景, G7算力平臺可提供2U空間4節(jié)點產(chǎn)品,單機(jī)柜算力可提升4.2倍;而面對I/O擴(kuò)展需求,G7算力平臺全系支持雙OCP及Multi-host網(wǎng)卡擴(kuò)展,支持在線熱維護(hù)等,性能提升10%以上。
G7算力平臺支持8種主流通用處理器芯片,51種加速計算芯片,打造包括通用計算、AI計算、高端計算、應(yīng)用優(yōu)化、整機(jī)柜、一體機(jī)等產(chǎn)品,并搭載浪潮信息KeyarchOS操作系統(tǒng),實現(xiàn)了服務(wù)器的軟硬件協(xié)同系統(tǒng)優(yōu)化。
精益求精 穩(wěn)定輸出澎湃算力
建筑設(shè)計最基本的要求是安全,結(jié)構(gòu)安全性是防止破壞倒塌的能力,是結(jié)構(gòu)工程最重要的質(zhì)量指標(biāo),體現(xiàn)在材料、結(jié)構(gòu)、消防、電氣等建筑的各方面。浪潮信息對于產(chǎn)品的打造也一直如此,堅持將精益求精的設(shè)計理念融匯到每個產(chǎn)品,打造高RAS特性。
G7算力平臺采用 "整機(jī)3層保護(hù)模式",從物理的硬件冗余、系統(tǒng)的降額設(shè)計及軟件的系統(tǒng)保護(hù)設(shè)計上層層提升產(chǎn)品可靠性。關(guān)鍵部件的冗余設(shè)計,如CPU供電采用多路供電方式,風(fēng)扇、PSU等部件的N+1冗余設(shè)計,BIOS、BMC的雙ROM設(shè)計等,在一個器部件故障后,冗余的器部件可以保障系統(tǒng)作業(yè)不會中斷。
系統(tǒng)的降額設(shè)計,當(dāng)機(jī)柜供電能力受限或者單個PSU供電不足時,浪潮信息獨有的動態(tài)Power Capping技術(shù)提供過載實時響應(yīng)措施確保系統(tǒng)供電安全,確保業(yè)務(wù)連續(xù)性,實現(xiàn)主板MTBF無故障工作時間超過24W小時。這背后是主板上每一顆電容的嚴(yán)苛選擇,通過千萬次的測試和仿真實驗,優(yōu)化元器件布局和散熱策略,減少元器件壓力及減緩老化,從而延長產(chǎn)品壽命,避免業(yè)務(wù)場景不同或機(jī)房差異帶來的系統(tǒng)工作異常問題;而軟件的系統(tǒng)保護(hù)是可靠算力的再一次進(jìn)化,為了支持更多部件的熱插拔保護(hù),G7算力平臺支持PSU、風(fēng)扇、硬盤、OCP網(wǎng)卡等多個部件的Efuse保護(hù)機(jī)制,當(dāng)出現(xiàn)異常時可實現(xiàn)毫秒級直接熔斷,為系統(tǒng)提供強(qiáng)力保護(hù)。
除了產(chǎn)品級的嚴(yán)苛設(shè)計,浪潮信息自有的王牌實驗室——"澎湃實驗室"對每款產(chǎn)品都要進(jìn)行2000多項測試,包括30余項極限測試,開發(fā)的工藝文件、生產(chǎn)品控標(biāo)準(zhǔn)經(jīng)由信息系統(tǒng)分發(fā)至世界各地工廠,通過智能制造系統(tǒng)統(tǒng)一執(zhí)行,從而實現(xiàn)全球高品質(zhì)交付。