omniture

仿得又快又準(zhǔn),浪潮信息元腦服務(wù)器支持電科院電力實(shí)時(shí)仿真

2024-07-11 13:04 3894

北京2024年7月11日 /美通社/ -- 隨著社會(huì)經(jīng)濟(jì)的發(fā)展,預(yù)計(jì)未來(lái)幾年用電增長(zhǎng)將維持在5%左右的中高速區(qū)間,而電力作為重要能源,需要高效管理,電力系統(tǒng)的全數(shù)字實(shí)時(shí)仿真平臺(tái),是提升電網(wǎng)快速響應(yīng)的關(guān)鍵環(huán)節(jié)之一,它可以幫助國(guó)家電網(wǎng)公司各級(jí)調(diào)度計(jì)算分析人員協(xié)同開(kāi)展重點(diǎn)活動(dòng)前期、夏季用電高峰期等不同場(chǎng)景下電力運(yùn)行的仿真分析,幫助電力系統(tǒng)運(yùn)行管理人員及時(shí)、準(zhǔn)確地分析和判斷系統(tǒng)運(yùn)行狀態(tài),制定保障電網(wǎng)安全高效運(yùn)行的控制策略,因此仿真平臺(tái)仿得又快又準(zhǔn)是業(yè)務(wù)的關(guān)鍵。

中國(guó)電科院與浪潮信息聯(lián)合,基于元腦服務(wù)器TS860G7產(chǎn)品,為中國(guó)電科院電力系統(tǒng)全數(shù)字實(shí)時(shí)仿真(ADPSS)平臺(tái)打造了更高性能、更穩(wěn)定的算力平臺(tái),提供超強(qiáng)并行處理能力,實(shí)時(shí)效率躍升30%,讓仿真平臺(tái)為電力系統(tǒng)的穩(wěn)定運(yùn)行提供保障。


全數(shù)字實(shí)時(shí)仿真系統(tǒng)在新型電力系統(tǒng)構(gòu)建中的算力挑戰(zhàn)

國(guó)家電網(wǎng)作為守護(hù)國(guó)家能源安全及國(guó)民經(jīng)濟(jì)命脈的重要支柱,在以新能源為主體的新型電力系統(tǒng)構(gòu)建中,面臨著負(fù)荷需求的急劇增長(zhǎng)和發(fā)電裝機(jī)數(shù)量的逐年增加。隨著1000kV特高壓線路和智能變電站的密集投運(yùn),電網(wǎng)結(jié)構(gòu)變得日益復(fù)雜,仿真系統(tǒng)的技術(shù)人員表示:電力系統(tǒng)作為科技發(fā)展的產(chǎn)物,不同時(shí)間下用電情況瞬息萬(wàn)變,電力系統(tǒng)是一個(gè)非常復(fù)雜的動(dòng)態(tài)系統(tǒng),如果要更高效地保障電網(wǎng)的穩(wěn)定性,就需要通過(guò)實(shí)時(shí)仿真技術(shù),對(duì)電網(wǎng)進(jìn)行分析、掌握電網(wǎng)特性,最終為系統(tǒng)運(yùn)行提供決策輔助,所以"仿得快、仿得準(zhǔn)"是對(duì)實(shí)時(shí)仿真系統(tǒng)提出的要求,這才能更好地保障電網(wǎng)的安全穩(wěn)定。

然而,在實(shí)施全數(shù)字實(shí)時(shí)仿真系統(tǒng)的過(guò)程中,算力支持面對(duì)三大挑戰(zhàn):

  • 仿真接入復(fù)雜度劇增:當(dāng)前,新能源、虛擬電廠大規(guī)模并網(wǎng)顯著增加了電網(wǎng)設(shè)備的基數(shù)與架構(gòu)的復(fù)雜性,國(guó)家電網(wǎng)經(jīng)營(yíng)區(qū)覆蓋了26個(gè)?。ㄗ灾螀^(qū)、直轄市),輸電線路長(zhǎng)度超過(guò)150萬(wàn)千米,系統(tǒng)規(guī)模超過(guò)10萬(wàn)個(gè)三相節(jié)點(diǎn)。而超大型電力系統(tǒng)電磁暫態(tài)仿真平臺(tái)仿真規(guī)模達(dá)到上萬(wàn)節(jié)點(diǎn),這對(duì)實(shí)時(shí)仿真系統(tǒng)的兼容性和靈活性構(gòu)成嚴(yán)峻考驗(yàn)。
  • 計(jì)算性能瓶頸:隨著仿真需求的增大,大規(guī)模機(jī)電與電磁仿真案例的并發(fā)處理壓力巨大,而超大型電力系統(tǒng)電磁暫態(tài)仿真平臺(tái)相當(dāng)于電力系統(tǒng)的‘作戰(zhàn)沙盤(pán)’,無(wú)論技術(shù)人員身處北京電網(wǎng)中心、還是遠(yuǎn)在千里外的邊陲區(qū)域,都需要借助仿真系統(tǒng)的能力對(duì)機(jī)電暫態(tài)、機(jī)電-電磁混合、全電磁暫態(tài)進(jìn)行仿真分析幫助業(yè)務(wù)決策,所以實(shí)時(shí)仿真的效率需要不斷提升,而現(xiàn)有的計(jì)算資源難以滿足高效并行運(yùn)算的需求,亟需計(jì)算能力的革新和升級(jí)。
  • 通信時(shí)延的敏感性:電網(wǎng)實(shí)時(shí)仿真的精確性依賴于對(duì)瞬態(tài)狀態(tài)的精準(zhǔn)捕捉,需要將電網(wǎng)仿真時(shí)間尺度細(xì)化至微秒級(jí),任何內(nèi)部通信微小的延遲都可能影響仿真的準(zhǔn)確性,2017年時(shí)仿真平臺(tái)的研發(fā)人員攻克了50微秒實(shí)時(shí)仿真步長(zhǎng)的難題,意味著系統(tǒng)在1秒鐘可內(nèi)對(duì)華東電網(wǎng)6000個(gè)節(jié)點(diǎn)進(jìn)行20000次計(jì)算,而當(dāng)仿真步長(zhǎng)越小時(shí),仿真模型越準(zhǔn)確,所以新算力平臺(tái),研究人員要求通信接口的響應(yīng)時(shí)間嚴(yán)格控制在10微秒以內(nèi),以消除可能的仿真誤差,保障仿真結(jié)論的準(zhǔn)確性。

TS860G7為ADPSS仿真系統(tǒng)提供高性能、低延時(shí)算力支持

面對(duì)既要仿得快,又要仿得準(zhǔn)的需求,中國(guó)電科院在為ADPSS仿真系統(tǒng)搭建核心算力平臺(tái)時(shí)進(jìn)行了嚴(yán)苛的選型,要求算力平臺(tái)要具備更高性能、更低延遲、更可靠穩(wěn)定的特性,能從容面對(duì)"多并發(fā)、低延時(shí)"的業(yè)務(wù)場(chǎng)景,有效地緩解現(xiàn)有系統(tǒng)的運(yùn)行壓力并減少系統(tǒng)響應(yīng)時(shí)間。經(jīng)過(guò)縝密細(xì)致的選型對(duì)比之后,中國(guó)電科院最終選擇了浪潮信息元腦服務(wù)器TS860G7作為ADPSS仿真系統(tǒng)核心算力平臺(tái)的IT設(shè)備,提供所需的算力。


ADPSS仿真系統(tǒng)在應(yīng)用時(shí)面臨不同的業(yè)務(wù)場(chǎng)景,包括場(chǎng)站級(jí)全電磁暫態(tài)仿真計(jì)算及半實(shí)物驗(yàn)證,和大型區(qū)域電網(wǎng)電磁暫態(tài)仿真計(jì)算及系統(tǒng)級(jí)試驗(yàn)驗(yàn)證,不同的作業(yè)規(guī)模也對(duì)應(yīng)著不同的仿真需求和作業(yè)的數(shù)據(jù)量,而核心大型平臺(tái)需要單硬件平臺(tái)仿真數(shù)據(jù)量的規(guī)模需要達(dá)到50us仿真步長(zhǎng)、不低于8000母線、不少于300臺(tái)風(fēng)機(jī),業(yè)務(wù)場(chǎng)景有時(shí)需要一兩百個(gè)處理器同時(shí)參與計(jì)算,每個(gè)處理器之間都有一定的數(shù)據(jù)通信量,如果應(yīng)用傳統(tǒng)的雙路服務(wù)器,跨節(jié)點(diǎn)間的CPU訪問(wèn),就要通過(guò)多機(jī)互聯(lián),而多機(jī)互聯(lián)之間的通信一般通過(guò)InfiniBand 100G網(wǎng)卡來(lái)實(shí)現(xiàn),這種通信網(wǎng)絡(luò)延時(shí)開(kāi)銷(xiāo)較大,會(huì)影響整個(gè)業(yè)務(wù)性能,也就導(dǎo)致喪失了ADPSS仿真實(shí)時(shí)的能力。

TS860G7整機(jī)通過(guò)架構(gòu)優(yōu)化和全模塊化設(shè)計(jì),單機(jī)最大支持480核心,核心數(shù)提高114%。采用業(yè)界最優(yōu)的高速連接器選型,首創(chuàng)線板方案并進(jìn)行阻抗匹配,通過(guò)全互聯(lián)拓?fù)浼軜?gòu),高速互聯(lián)鏈路傳輸速率提升105%;同時(shí)TS860G7還支持PCIe5.0高速帶寬,IO傳輸帶寬提升6.3倍,可以很好地滿足多任務(wù)的并行計(jì)算,高效地支撐千節(jié)點(diǎn)級(jí)機(jī)電和暫態(tài)實(shí)時(shí)仿真運(yùn)算任務(wù)。

針對(duì)ADPSS仿真系統(tǒng)的低延時(shí)需求,TS860G7在整機(jī)的架構(gòu)設(shè)計(jì)上實(shí)現(xiàn)業(yè)界最優(yōu)的器部件布局和布線,減少信號(hào)衰減和串?dāng)_,提高信號(hào)通信性能,采用4組計(jì)算節(jié)點(diǎn),每組兩顆處理器并排,通過(guò)中置高速無(wú)源背板進(jìn)行互聯(lián),采用反向設(shè)計(jì)思路巧妙利用工藝制程減小串?dāng)_影響,成本0增加的情況下實(shí)現(xiàn)布線密度和走線路徑雙優(yōu)化,結(jié)合全頻帶的三維無(wú)源仿真,從而減少信號(hào)衰減,保障CPU的跨socket訪問(wèn)時(shí)延最低。同時(shí)采用IO balance連接模式,每顆CPU可直接訪問(wèn)所需支持的PCIe卡,相比于經(jīng)過(guò)其他CPU通路二次連接的非Balance模式大幅降低延遲,提升性能;同時(shí)整機(jī)全PCIe5.0的鏈路設(shè)計(jì)可以將200GB IB卡的傳輸效率發(fā)揮到最佳,實(shí)現(xiàn)不降級(jí)、不降速的傳輸效果。

此外,為了保障電力仿真系統(tǒng)高性能低延時(shí)的穩(wěn)定運(yùn)行,面對(duì)關(guān)鍵應(yīng)用系統(tǒng)TS860G7提供更穩(wěn)定的算力供給,在部件級(jí)、模塊級(jí)、鏈路級(jí)、系統(tǒng)級(jí)四方面采用RAS設(shè)計(jì),提供部件級(jí)到芯片級(jí)的冗余設(shè)計(jì),保證數(shù)據(jù)在計(jì)算、存儲(chǔ)、I/O等各個(gè)環(huán)節(jié)穩(wěn)定可靠,而且TS860G7具備預(yù)警和修復(fù)故障的能力,可以預(yù)測(cè)并隔離修復(fù)包括內(nèi)存、硬盤(pán)等高故障部件的健康狀態(tài),保障整機(jī)MTBF(平均無(wú)故障最大工作時(shí)間)達(dá)到20萬(wàn)小時(shí)以上。

通過(guò)以浪潮信息元腦服務(wù)器TS860G7為核心打造算力平臺(tái),中國(guó)電科院電力系統(tǒng)全數(shù)字實(shí)時(shí)仿真系統(tǒng)(ADPSS),極大增強(qiáng)了仿真系統(tǒng)的并行處理能力,實(shí)時(shí)計(jì)算集群的效率躍升30%,為處理復(fù)雜電網(wǎng)模型和大規(guī)模仿真任務(wù)提供了強(qiáng)大動(dòng)力,升級(jí)后的系統(tǒng)在實(shí)時(shí)通信方面取得了突破,單節(jié)點(diǎn)內(nèi)部及資源組間的通信抖動(dòng)均被控制在5微秒以下,遠(yuǎn)低于行業(yè)標(biāo)準(zhǔn),更高效地保證了大電網(wǎng)電磁暫態(tài)仿真精度。同時(shí)借助浪潮信息自研的智能運(yùn)維工具,故障診斷與處理能力得到質(zhì)的提升,運(yùn)維效率提高了60%,運(yùn)維團(tuán)隊(duì)能夠更快識(shí)別并解決潛在問(wèn)題,減少停機(jī)時(shí)間,確保仿真系統(tǒng)持續(xù)高效、穩(wěn)定地運(yùn)行。

消息來(lái)源:浪潮信息
China-PRNewsire-300-300.png
能動(dòng)
微信公眾號(hào)“能動(dòng)”發(fā)布全球能源、化工、采礦、動(dòng)力、新能源車(chē)企業(yè)最新的經(jīng)營(yíng)動(dòng)態(tài)。掃描二維碼,立即訂閱!
collection