北京2021年8月19日 /美通社/ -- 作為世界經(jīng)濟(jì)發(fā)展以及新一輪科技產(chǎn)業(yè)創(chuàng)新的核心領(lǐng)域,生物醫(yī)藥產(chǎn)業(yè)正快速挺進(jìn)蓬勃發(fā)展階段。對(duì)此,被譽(yù)為國(guó)家級(jí)實(shí)驗(yàn)室“預(yù)備隊(duì)”的生物島實(shí)驗(yàn)室,應(yīng)勢(shì)選擇了以云智一體為核心的浪潮云??蒲性平鉀Q方案,為更加智能地開(kāi)展科研醫(yī)療工作,投身建設(shè)生物醫(yī)學(xué)大數(shù)據(jù)科研軟件平臺(tái)中。
為了更好整合國(guó)內(nèi)外再生醫(yī)學(xué)與健康領(lǐng)域創(chuàng)新資源,積極布局以再生醫(yī)學(xué)前沿基礎(chǔ)研究、臨床創(chuàng)新研究等為代表的重要科研方向,進(jìn)一步打造再生醫(yī)學(xué)與健康前沿研究基地、臨床應(yīng)用基地與高水平人才基地,并加快推進(jìn)生物醫(yī)學(xué)科研創(chuàng)新應(yīng)用向云智一體化方向發(fā)展,生物島實(shí)驗(yàn)室攜手浪潮云海,如火如荼地展開(kāi)了生物醫(yī)學(xué)大數(shù)據(jù)科研軟件平臺(tái)的建設(shè)工作。
遭遇平臺(tái)建設(shè)“絆腳石” 部署、算力、管理、應(yīng)用均有疑難
盡管平臺(tái)建設(shè)意義重大,但著手之初還是不可避免“遭遇”了來(lái)自節(jié)點(diǎn)采集、算力支持、管理協(xié)同以及應(yīng)用創(chuàng)新等“絆腳石”,具體來(lái)說(shuō):
“節(jié)點(diǎn)部署限制多 彈性穩(wěn)定成剛需”為了更好助力醫(yī)療業(yè)務(wù)效率提升以及精準(zhǔn)醫(yī)療大數(shù)據(jù)應(yīng)用,高效的數(shù)據(jù)采集變得十分關(guān)鍵,而節(jié)點(diǎn)部署更是重中之重。通常,采集節(jié)點(diǎn)主要部署在數(shù)據(jù)源單位例如醫(yī)院中,來(lái)負(fù)責(zé)本地采集、挖掘分析以及共享管理等工作,數(shù)據(jù)來(lái)源更是涉及HIS、RIS、LIS、 PACS、基因、組學(xué)等多類(lèi)型系統(tǒng),復(fù)雜量大,需要滿(mǎn)足采集節(jié)點(diǎn)對(duì)資源彈性、擴(kuò)展性、穩(wěn)定性等方面的需求。
如此看來(lái)常規(guī)的物理機(jī)部署架構(gòu)很難滿(mǎn)足上述要求,采用輕量高效、高穩(wěn)定性、易運(yùn)維擴(kuò)展的虛擬化架構(gòu)來(lái)支撐采集節(jié)點(diǎn)部署,就顯得十分重要。
“高效算力更關(guān)鍵 效率提升最迫切”眾所周知,生物醫(yī)學(xué)研究以數(shù)據(jù)量大、計(jì)算要求高等特質(zhì)著稱(chēng)。舉個(gè)例子來(lái)說(shuō),有數(shù)據(jù)顯示一次人體的全基因組檢測(cè)就會(huì)產(chǎn)生超過(guò)100G的數(shù)據(jù)量,就算做局部檢測(cè)涉及到的大樣本批量處理也會(huì)帶來(lái)極高的計(jì)算需求。
此外針對(duì)某種疾病的研究,更是需要通過(guò)對(duì)多達(dá)幾千對(duì)的基因數(shù)據(jù)進(jìn)行測(cè)序工作才可完成研究第一步,而目前的醫(yī)療機(jī)構(gòu)以現(xiàn)階段的設(shè)備水平則需數(shù)年才可搞定。反觀傳統(tǒng)CPU的運(yùn)算能力,根本無(wú)法支撐如此生物醫(yī)學(xué)科研需求,所以如何通過(guò)新建更高性能的算力平臺(tái)來(lái)提升科研分析訓(xùn)練的效率,也成為本次平臺(tái)建設(shè)需要重點(diǎn)考量的問(wèn)題。
“多分支管理難度大,資源協(xié)同是關(guān)鍵”過(guò)去,實(shí)驗(yàn)室中多個(gè)數(shù)據(jù)采集節(jié)點(diǎn)基本呈現(xiàn)分散無(wú)序的狀態(tài),對(duì)此帶來(lái)的資源協(xié)同難度大、運(yùn)維管理更復(fù)雜以及維護(hù)成本居高不下等問(wèn)題始終困擾生物島實(shí)驗(yàn)室,并對(duì)中心節(jié)點(diǎn)科研平臺(tái)建設(shè)帶來(lái)挑戰(zhàn),所以達(dá)成資源的統(tǒng)一調(diào)度、計(jì)算協(xié)同以及統(tǒng)一運(yùn)維等后續(xù)服務(wù)迫在眉睫。
“傳統(tǒng)架構(gòu)阻創(chuàng)新,微服務(wù)容器助敏捷”伴隨云原生、人工智能、數(shù)字計(jì)算等創(chuàng)新科技的快速發(fā)展,傳統(tǒng)以資源為中心的應(yīng)用部署模式很難滿(mǎn)足高效編排、快速迭代等需求,亟需在保障數(shù)據(jù)安全的基礎(chǔ)上建設(shè)微服務(wù)應(yīng)用容器平臺(tái)?;谖⒎?wù)容器架構(gòu)開(kāi)展協(xié)同挖掘分析、模型訓(xùn)練、智能工具集成、知識(shí)庫(kù)集成等創(chuàng)新應(yīng)用建設(shè),為各級(jí)科研人員及第三方大數(shù)據(jù)人工智能企業(yè)提供多維度的科研創(chuàng)新服務(wù)。
云智深度融合科研云解決方案全面助力科研創(chuàng)新與業(yè)務(wù)智能
為更好解決生物醫(yī)學(xué)在科研創(chuàng)新與業(yè)務(wù)應(yīng)用方面的諸多問(wèn)題,浪潮云海深諳其中之道,推出了以云智一體為核心的科研云解決方案。該方案基于開(kāi)放、融合、敏捷、智能的原則,按照集約建設(shè)、分層解耦、云邊協(xié)同的建設(shè)思路構(gòu)建一套融合虛擬化、容器、人工智能和 PC的科研云平臺(tái)。
做到向上提供統(tǒng)一的服務(wù)目錄,將基礎(chǔ)設(shè)施、人工智能、邊緣計(jì)算、高性能計(jì)算等資源全面云服務(wù)化,為科研創(chuàng)新應(yīng)用提供全棧云服務(wù),高效解決伴隨平臺(tái)建設(shè)諸多問(wèn)題的同時(shí),讓生物醫(yī)學(xué)科研“落地有聲”。
云邊協(xié)同讓數(shù)據(jù)“少跑路”,處理效率突飛
為了更好解決科研平臺(tái)數(shù)據(jù)采集節(jié)點(diǎn)(子節(jié)點(diǎn))在數(shù)據(jù)源單位的部署運(yùn)維、資源調(diào)度以及協(xié)同計(jì)算等問(wèn)題,浪潮云海在項(xiàng)目中采用了云邊協(xié)同的方案架構(gòu)。 具體來(lái)說(shuō),實(shí)施該架構(gòu)首先在每個(gè)數(shù)據(jù)源單位各部署一套浪潮InCloud Rail超融合平臺(tái),提供數(shù)據(jù)采集、分析挖掘所需的算力和存儲(chǔ)支撐,優(yōu)先滿(mǎn)足數(shù)據(jù)本地化處理需求,實(shí)現(xiàn)數(shù)據(jù)“少跑路”。
各個(gè)子節(jié)點(diǎn)的超融合平臺(tái)由主心節(jié)點(diǎn)的科研云平臺(tái)統(tǒng)一納管,可實(shí)現(xiàn)跨地域、跨中心資源的統(tǒng)一調(diào)度、統(tǒng)一監(jiān)控、統(tǒng)一運(yùn)維,實(shí)現(xiàn)對(duì)科研工作的數(shù)字化、智能化、一體化管控。與此同時(shí),中心節(jié)點(diǎn)與各子節(jié)點(diǎn)形成“云邊協(xié)同”架構(gòu),可開(kāi)展科研協(xié)同訓(xùn)練,實(shí)現(xiàn)數(shù)據(jù)在不出子節(jié)點(diǎn)的情況下參與計(jì)算訓(xùn)練。
此外,中心節(jié)點(diǎn)云平臺(tái)還提供了應(yīng)用下發(fā)的能力,可以通過(guò)中心節(jié)點(diǎn)為各個(gè)子節(jié)點(diǎn)批量下發(fā)高效的臨床組學(xué)智能分析工具,大大提升了應(yīng)用交付效率,高達(dá)30%以上。即云平臺(tái)中心節(jié)點(diǎn)承載統(tǒng)一的應(yīng)用全局分發(fā)、管理、監(jiān)控、運(yùn)維及運(yùn)營(yíng)等工作,子節(jié)點(diǎn)則承擔(dān)應(yīng)用運(yùn)行以及監(jiān)控日志收集、清洗等,數(shù)據(jù)處理效率提升。
高效融合AI與HPC,計(jì)算能力猛進(jìn)
為了更好支撐生物島實(shí)驗(yàn)室的基因測(cè)序、醫(yī)療影像三維重構(gòu)、醫(yī)療圖像分析等HPC和AI應(yīng)用,浪潮云海在本次建設(shè)的科研云平臺(tái)中融合了人工智能和HPC能力,總體算力超千萬(wàn)億次,可用存儲(chǔ)空間大于 3PB,效率提速20倍之多,充分滿(mǎn)足生物醫(yī)學(xué)研究對(duì)計(jì)算分析、數(shù)據(jù)存儲(chǔ)的剛需。 此外,本次項(xiàng)目依托浪潮HPC集群管理平臺(tái)ClusterEngine,打通硬件運(yùn)維、業(yè)務(wù)管理和應(yīng)用性能分析,大幅提升集群的資源利用率和計(jì)算效率,針對(duì)基因測(cè)序方面應(yīng)用場(chǎng)景可以將人和類(lèi)似哺乳動(dòng)物的全基因組組裝時(shí)間縮短到2天以?xún)?nèi)。
基于浪潮人工智能平臺(tái)承載的醫(yī)療影像分析、AI輔助診斷等相關(guān)應(yīng)用研究工作,高效支撐了生物實(shí)驗(yàn)室海量的醫(yī)療影像數(shù)據(jù)計(jì)算,數(shù)倍提升了AI模型的訓(xùn)練效率。
搭載微服務(wù)容器平臺(tái),科研應(yīng)用創(chuàng)新顯著
為了高效落地科研創(chuàng)新應(yīng)用建設(shè),本次部署的浪潮云海容器平臺(tái)基于微服務(wù)架構(gòu),通過(guò)多種應(yīng)用編排模式集成各類(lèi)資源,包括多節(jié)點(diǎn)數(shù)據(jù)的協(xié)同挖掘分析和算法模型訓(xùn)練、智能工具集成、知識(shí)庫(kù)集成等創(chuàng)新應(yīng)用;同時(shí)整合了第三方大數(shù)據(jù)及醫(yī)療人工智能企業(yè)智能應(yīng)用等,形成了生物醫(yī)學(xué)大數(shù)據(jù)共享應(yīng)用平臺(tái),進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)、知識(shí)、技術(shù)協(xié)同創(chuàng)新。
目前,生物島實(shí)驗(yàn)室科研云平臺(tái)已全面投入使用,已經(jīng)基于該平臺(tái)開(kāi)展了高效的標(biāo)準(zhǔn)化生物信息分析、臨床多組學(xué)數(shù)據(jù)科研挖掘和臨床分子檢測(cè)智能解讀等工作。未來(lái)還將整合臨床醫(yī)學(xué)知識(shí)圖譜及人工智能技術(shù),不斷覆蓋基因組學(xué)、代謝組學(xué)、蛋白質(zhì)組學(xué)、表觀遺傳學(xué)等多維度組學(xué)測(cè)序數(shù)據(jù),構(gòu)建更完整的患者閉環(huán)數(shù)據(jù)鏈條,全面支持精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)應(yīng)用。
“浪潮云海提供的云智一體為核心的科研云解決方案,讓我們親眼見(jiàn)證了云智深度融合的巨大實(shí)力:不但保障了數(shù)據(jù)采集的高效穩(wěn)定,還幫助我們極大提升了算力水平和處理效率,更為科研應(yīng)用創(chuàng)新邁出了堅(jiān)實(shí)的一步?!鄙飴u實(shí)驗(yàn)室方面表示。
浪潮云海作為智算操作系統(tǒng)核心引擎,未來(lái)將持續(xù)踐行“貼近客戶(hù)、實(shí)踐創(chuàng)新”的理念,不斷在實(shí)際需求場(chǎng)景中打磨優(yōu)秀的產(chǎn)品以及解決方案,為生物科研的數(shù)字化、智能化轉(zhuǎn)型提供更加堅(jiān)實(shí)的云數(shù)智融合底座。