為實現(xiàn)學(xué)校高性能計算資源統(tǒng)一管理,保障計算資源能夠高效、合理使用和可持續(xù)發(fā)展,根據(jù)一流大學(xué)(學(xué)科)開展高水平科學(xué)研究、前沿科技探索和創(chuàng)新型人才培養(yǎng)的發(fā)展需要,蘭州大學(xué)超算中心于2019年5月成立。中心面向全校師生提供高性能科學(xué)與工程計算服務(wù)的校級超算平臺,滿足學(xué)校多個學(xué)科對于大規(guī)模科學(xué)計算和海量存儲的需求。
該平臺集成了X86、ARM和GPU等各類硬件資源,系統(tǒng)復(fù)雜度高,部署和配置困難,容易出現(xiàn)兼容性問題。
項目背景
客戶需求
- 蘭州大學(xué)學(xué)科門類眾多,涉及計算的學(xué)科逐漸增加,計算需求多樣,從計算的傳統(tǒng)學(xué)科理工科,發(fā)展到實證科學(xué)、醫(yī)學(xué)、藥學(xué)、人文學(xué)科;
- 應(yīng)用和交互復(fù)雜,從傳統(tǒng)的連續(xù)問題離散化的高性能計算(OpenMP、MPI)到離散問題的大數(shù)據(jù)、深度學(xué)習(xí)、統(tǒng)計分析全覆蓋;從單純計算應(yīng)用、軟件調(diào)試、優(yōu)化模型到教學(xué)實驗;
- 既要滿足課題組統(tǒng)一調(diào)配使用,又要實現(xiàn)個人的使用。
客戶收益
- 采用容器技術(shù),實現(xiàn)應(yīng)用打包和應(yīng)用部署的分離;
- 引入鏡像管理,降低使用的門檻,提升應(yīng)用水平;
- 與學(xué)校統(tǒng)一身份認證系統(tǒng)掛接,教工、學(xué)生不需注冊;
- 封裝作業(yè)管理系統(tǒng),支持傳統(tǒng)的高性能計算作業(yè)提交模式;
- 支持各種使用場景:應(yīng)用的交互場景從ssh終端、Web Portal(網(wǎng)頁腳本、jupyter集成環(huán)境)到GUI圖形(ANSYS、GaussView,MATLAB)等;
- 以課題組的方式對用戶進行權(quán)限、數(shù)據(jù)、資源管理;引入移動應(yīng)用,以科研計算活動為主線,將計算相關(guān)的人和事連接,以個人計算環(huán)境作為服務(wù)。