隨著工業(yè)電子信息產(chǎn)業(yè)的發(fā)展,高性能計算已經(jīng)逐步由單機處理逐漸發(fā)展至集群化,很多企業(yè)存在自建高性能計算集群的需求。但在實際生產(chǎn)及使用方面,仍存在諸多方面的問題,例如集群搭建和維護工作繁重,需要投入很多物力和人力,使企業(yè)無法全力聚焦在主要業(yè)務上。另外,或硬件設備更新迭代速度快,計算量快速膨脹,新技術層出不窮,初期規(guī)劃無法適應新的業(yè)務需求。因此,充分借用云端的集群管理能力,成為越來越多客戶的高性價比選擇。
針對科學計算、基因工程、氣象電力、生物醫(yī)藥、工程制造等高算力場景, 近期,UCloud推出了全新升級的高性能計算集群,并新增獨占集群管理功能,為高算力業(yè)務場景下的客戶提供便捷高效的集群管理服務。
針對用戶需求,支持獨占集群與共享集群
EPC高性能計算集群集成UCloud的計算、存儲、網(wǎng)絡等資源,為客戶提供便捷管理、可彈性伸縮的高性能計算服務。目前EPC分為獨占集群和共享集群兩種形態(tài):
獨占集群為客戶創(chuàng)建的私有集群,客戶可獨占集群內(nèi)的所有算力資源,自定義集群內(nèi)部運行環(huán)境,自主安裝系統(tǒng)應用。也是本次產(chǎn)品升級的重點,下面會詳細介紹一下。同時提供可多點掛載的共享存儲,同項目下的所有計算節(jié)點共享存儲空間,在滿足客戶多節(jié)點共享數(shù)據(jù)的需求外,也一定程度上減低客戶的存儲成本,做到真正的降本增效。
共享集群則為所有用戶共享的算力的計算集群,客戶無需關注資源的調(diào)度和管理,僅根據(jù)自身需求,提交計算任務即可。
獨占集群
獨占集群模式下,UCloud提供兩種資源部署方式,一種是集群部署,一種是節(jié)點組。在集群部署模式下,UCloud為客戶提供作業(yè)調(diào)度軟件的自動化部署功能,客戶僅需要根據(jù)自身的實際業(yè)務需要來選擇計算資源配置,磁盤以及網(wǎng)絡資源,系統(tǒng)即可為客戶一鍵創(chuàng)建高性能計算集群。
客戶可以通過登錄節(jié)點提交和分配計算任務,在計算節(jié)點執(zhí)行計算任務。產(chǎn)品架構如下圖所示:
在節(jié)點組部署模式下,UCloud為客戶提供批量創(chuàng)建計算節(jié)點的能力,用戶可一次性選擇創(chuàng)建單臺或者多臺計算節(jié)點,同步配置磁盤、網(wǎng)絡,提供部分科研場景下的常用軟件,無需關注基礎的環(huán)境搭建,開機即可運算,科研效率大大提升。
共享存儲
EPC高性能集群提供了支持多點掛載的共享存儲,同項目下的所有節(jié)點資源均可掛載在同一塊共享存儲上,可極大滿足客戶多計算節(jié)點共享數(shù)據(jù)源的需求。
當客戶創(chuàng)建集群或者計算節(jié)點時,節(jié)點自動掛載共享存儲,支持在線擴容,滿足客戶數(shù)據(jù)彈性存儲需求。同時提供FTP文件上傳下載功能,外網(wǎng)帶寬最高可達100M。同時,EPC共享存儲支持SMB協(xié)議和NFS協(xié)議,可滿足不同客戶Windows和Linux系統(tǒng)的使用需求。
提升科研算力,具備五項優(yōu)勢
資源豐富,彈性擴容
依托于UCloud公有云海量計算資源,可滿足客戶業(yè)務高峰時大量資源需求。
靈活部署
支持多種實例規(guī)格,滿足科學計算、基因測序、建模仿真等多種應用類別。
提供資源管理、作業(yè)調(diào)度服務
提供自動化部署slurm調(diào)度器的能力,一鍵部署集群,支持集群任務調(diào)度。
支持共享存儲
提供支持多點掛載的共享集群,創(chuàng)建時自動掛載。
計費方式靈活
支持包年包月、小時計費多種計費方式,客戶按需使用計算資源服務,在滿足業(yè)務需求同時,有效節(jié)約成本。
EPC助力多領域科研場景降本增效
生物信息領域
生物信息領域涵蓋基因測序、基因分型、精準醫(yī)學、個性化治療等多種研究領域。上海某大學課題組在使用冷凍電鏡技術對病毒蛋白質(zhì)樣本成像和重建實驗中,利用UCloud EPC服務,通過RELION軟件的GPU加速功能,加速病毒蛋白質(zhì)的三維結(jié)構的重建(對幾十萬張2D或3D投影圖片進行分析、組裝和優(yōu)化)。
分子模擬領域
分子模擬領域研究光譜預測、電子密度分布等物質(zhì)表征模擬需求,也支持蛋白質(zhì)-藥物配體動力學、近場動力學、碳納米管束等計算高度密集的科學問題。浙江某大學采用UCloud EPC服務,使用Gromacs軟件對膳食卵清蛋白與葉酸的相互作用機理進行了研究,大幅提升研究效率。
人工智能領域
人工智能涵蓋深度學習和強化學習,通過算法模型訓練,應用于計算機視覺、自然語言處理、推薦引擎等場景。安徽某學院借助UCloud EPC服務,研究基于PyTorch的深度學習模型,進行心電公共數(shù)據(jù)端到端的分類,整體模型訓練的效率得到極大的提升。