北京2025年1月8日 /美通社/ -- 云南,這片被大自然偏愛的神奇土地,坐擁"動(dòng)植物王國"的赫赫威名,其生物多樣性傲居全國之首。得天獨(dú)厚的自然條件,讓云南成為植物認(rèn)知、藥物研發(fā)和保護(hù)植物多樣性的前沿陣地。
植物天然產(chǎn)物研究和藥物研發(fā)需要生物學(xué)、化學(xué)、物理學(xué)與藥學(xué)等多個(gè)學(xué)科交叉研究,充滿了未知與挑戰(zhàn)。隨著科研工作的不斷深入,傳統(tǒng)的研究手段逐漸變?yōu)橛蓴?shù)據(jù)驅(qū)動(dòng)的方式,通過計(jì)算機(jī)模擬可以加速植物天然產(chǎn)物及其相關(guān)藥物的研發(fā)進(jìn)程,發(fā)掘更深層次的科學(xué)問題。
為此,浪潮信息為中國科學(xué)院昆明植物所構(gòu)建了一個(gè)集科學(xué)計(jì)算、大數(shù)據(jù)存儲(chǔ)和智能化管理于一體的多學(xué)科計(jì)算服務(wù)平臺(tái),為植物天然產(chǎn)物挖掘、藥物活性成分探尋、化合物分子精細(xì)建模與優(yōu)化,以及新藥創(chuàng)制等一系列復(fù)雜科研流程注入新的動(dòng)力。
從植物天然產(chǎn)物到藥物研發(fā),多學(xué)科應(yīng)用融合的荊棘之路
構(gòu)建完善的研發(fā)體系需要海量科學(xué)大數(shù)據(jù)的積累,從而支撐植物學(xué)、植物天然產(chǎn)物化學(xué)、藥物學(xué)等科研領(lǐng)域的深入研究,這對于認(rèn)識(shí)、利用和保護(hù)植物多樣性以及發(fā)現(xiàn)植物天然產(chǎn)物藥物具有重要意義。然而,隨著新技術(shù)和新應(yīng)用的不斷涌現(xiàn),科研數(shù)據(jù)量和計(jì)算量呈現(xiàn)指數(shù)級增長,這使得全新規(guī)劃的多學(xué)科計(jì)算服務(wù)平臺(tái)建設(shè)面臨著前所未有的挑戰(zhàn)。
如今,生物大分子模擬、核酸分析等計(jì)算密集型應(yīng)用在科研任務(wù)中廣泛使用,對于算力的需求也是水漲船高。以研究多糖類藥物合成過程為例,糖分子因其獨(dú)特、復(fù)雜的結(jié)構(gòu)與功能,難以用常規(guī)遺傳密碼解讀,需要利用Amber等分子動(dòng)力學(xué)應(yīng)用開展生物大分子計(jì)算模擬,以直觀地展現(xiàn)糖分子在溶液環(huán)境中的構(gòu)象變化情況,預(yù)測不同合成策略下得到的糖分子結(jié)構(gòu)特征,對比分析哪種方案更有可能合成出具有理想活性的目標(biāo)糖分子。這個(gè)過程涉及到大量原子間相互作用,以及復(fù)雜的化學(xué)鍵變化等諸多精細(xì)且繁雜的計(jì)算,同時(shí)要保證模擬的準(zhǔn)確性和精度,哪怕僅運(yùn)行數(shù)微秒到數(shù)十微秒,對算力的需求也十分巨大。
此外,在植物研究過程中將產(chǎn)生大量的科研數(shù)據(jù),需要采集處理高達(dá)數(shù)TB到數(shù)PB的數(shù)據(jù),涵蓋了植物樣本采集階段的基礎(chǔ)信息記錄、實(shí)驗(yàn)處理環(huán)節(jié)的各類參數(shù)設(shè)定、分析過程中產(chǎn)生的各層級多組學(xué)數(shù)據(jù)。以藥用和瀕危物種研究為例,需要運(yùn)用高通量篩選(HTS)技術(shù),對植物樣品材料深度剖析,以獲取相關(guān)基因組和nrDNA序列,構(gòu)建起精準(zhǔn)鑒定參考數(shù)據(jù)集。這要求存儲(chǔ)系統(tǒng)不僅具備高性能、高可靠性、高可擴(kuò)展性,還需要與原有云平臺(tái)無縫對接,實(shí)現(xiàn)數(shù)據(jù)的自由流通與共享。
因此,多學(xué)科計(jì)算服務(wù)平臺(tái)作為各大項(xiàng)目組的統(tǒng)一算力和存儲(chǔ)支撐平臺(tái),必須依據(jù)不同應(yīng)用的獨(dú)特需求,設(shè)計(jì)出清晰合理的數(shù)據(jù)流向,搭建統(tǒng)一、智能的計(jì)算資源管理體系,確保算力、存儲(chǔ)、網(wǎng)絡(luò)資源的高效利用,避免資源閑置或沖突。
打造多學(xué)科計(jì)算服務(wù)平臺(tái),元腦服務(wù)器加速天然藥物研發(fā)
綜合考慮科研對算力資源、高性能存儲(chǔ)、算網(wǎng)融合調(diào)度等需求,浪潮信息為昆明植物所量身定制了植物天然產(chǎn)物大數(shù)據(jù)中心多學(xué)科計(jì)算服務(wù)平臺(tái)。該平臺(tái)以元腦服務(wù)器NF5280G7和AS13000分布式存儲(chǔ)為核心支撐,同時(shí)部署Cluster Engine平臺(tái)優(yōu)化算力調(diào)度與管理。通過整合計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和應(yīng)用資源,極大地推動(dòng)植物科學(xué)研究的進(jìn)展,實(shí)現(xiàn)科研數(shù)據(jù)的高效管理和分析,加速科學(xué)發(fā)現(xiàn)和創(chuàng)新。
多學(xué)科計(jì)算服務(wù)平臺(tái)的建設(shè)與應(yīng)用,能夠更好地分析和處理實(shí)驗(yàn)數(shù)據(jù),加快新植物天然產(chǎn)物的發(fā)現(xiàn)速度,幫助昆明植物所的科研人員更準(zhǔn)確地識(shí)別和篩選具有潛在藥用價(jià)值的植物天然產(chǎn)物,從而加速新藥的研發(fā)進(jìn)程。