某生態創新中心是響應省數字經濟發展規劃、依托中俄區位優勢及黑粵對口合作建成的關鍵算力基礎設施,核心承載超算中心、AI訓練集群及云資源池三大板塊,旨在為基因測序、生物醫藥、制造業等領域提供國產化算力支撐,培育數字經濟新動能。作為整合產業創新資源的核心載體,超算中心需服務省內外企業、高校及科研機構,但傳統計算平臺逐漸暴露瓶頸:不同行業算力需求差異大,基因測序等場景需高并行計算,而中小企業則需要輕量化普惠算力;同時存在資源調度損耗高、多行業軟件適配復雜、運維管理難度大等問題。2022年8月試運營后,為突破算力服務瓶頸,超算中心采用EaaS高性能計算云平臺作為調度核心,實現算力資源高效配置與生態化服務。
項目背景
客戶需求
- 信創與生態協同需求:需構建國產化算力底座,適配信創產業要求,同時搭建開放生態,實現技術共享與成果轉化,培育本地科技企業。
- 性能損耗與適配效率問題:傳統虛擬化平臺存在計算性能衰減、存儲I/O開銷高、網絡隊列不均衡等問題,且X86架構軟件遷移適配難度大,影響科研與生產效率。
- 多行業差異化算力調度需求:服務基因測序、生物醫藥、農業科研等多元領域,需兼顧大規模并行計算與中小微企業普惠算力供給,解決傳統平臺資源分配僵化問題。
- 資源隔離與性能保證: 在多用戶共享、多任務并行的環境中,要求不同集群之間嚴格隔離,互相不影響,同時保證計算性能接近物理裸機水平。
客戶收益
- 極致性能與環境隔離: 平臺利用自研容器技術實現了對資源的細粒度隔離和控制。容器的物理性能損耗在 1% 以內,確保了大規模并行計算的效率。
- 實現全硬件兼容: 實現了對部署的所有鯤鵬處理器的完全適配,確保了國產算力基礎設施的穩定運行。通過聯旌自研核心容器技術,將應用與環境打包為標準鏡像,實現了“一次適配、處處運行”,保障了國產化硬件的潛能充分釋放。
- 資源統一管控: 平臺支持多套虛擬集群共存且互不干擾,。成功實現了統一的超算集群管理,滿足了創新中心對多場景、高安全性的要求。并通過與 Pacific 存儲系統的打通,解決了異構數據存儲和調用的難題。
- 提升服務效率: 平臺通過提供 Web 門戶、GUI 圖形化界面和豐富的應用商店(提供海量預構建科研軟件鏡像),極大降低了用戶使用高性能計算的學習門檻和部署時間,實現了應用實例的即時交付。