數據中心資源池
數據中心資源池解決方案是一種将數據中心的物理(lǐ)資源(如(rú)服務器、存儲、網絡)進行虛拟化和統一管理(lǐ)的技術(shù)方案,它可(kě)以實現資源的動态分(fēn)配和優化,提高資源的利用率和效率,降低資源的成本和風(fēng)險。
背景
某計(jì)算中心是國(guó)家重點研發計(jì)劃的重要組成部分(fēn),中心需要建設一個CPU與GPU混合算力集群平台,以支持中心的研究項目和應用需求,提高中心的計(jì)算能力和效率。
需求分(fēn)析
01.
構建卓越集群平台
集群平台應具備高性能、高可(kě)靠、高可(kě)擴展、高安全的特點,能夠滿足中心的各類計(jì)算任務的需求,包括高性能計(jì)算、大(dà)數據分(fēn)析、深度學習、圖像處理(lǐ)等。 展開
02.
混合架構卓越表現
集群平台應采用CPU與GPU混合的架構,利用CPU的通用性和GPU的并行性,實現高效的計(jì)算加速。集群平台應支持多種類型的GPU,包括英偉達、寒武紀等,以适應不同的計(jì)算場景和需求 展開
03.
卓越通信架構
集群平台應具備良好的網絡通信能力,采用高速、低延遲、高帶寬的網絡設備,實現節點間的高效數據傳輸和協同計(jì)算
04.
全面運維解決方案
集群平台應具備完善的管理(lǐ)和監控功能,采用統一的管理(lǐ)軟件(jiàn),實現集群的配置、調度、監控、故障處理(lǐ)等功能,提高集群的運維效率和可(kě)用性 展開
05.
雲端多租戶管理(lǐ)
集群平台雲管理(lǐ)功能,支持多租戶管理(lǐ),并能夠納管裸金屬服務器
方案描述
![](static/picture/74.png)
服務器
- 采用H3C R4900G5作(zuò)爲通用服務器、高性能服務器和國(guó)外GPU x86服務器載體(tǐ),搭配不同性能的CPU來(lái)提供相(xiàng)應的計(jì)算性能。采用飛騰服務器作(zuò)爲信創服務器及國(guó)産GPU載體(tǐ)。國(guó)外顯卡部署在2台通用GPUx86服務器上,而2塊國(guó)産顯卡部署在飛騰服務器上 展開
![](static/picture/82.png)
網絡
- 采用2台H3C全萬兆交換機(jī)作(zuò)爲業務交換機(jī)來(lái)上聯服務器與核心交換機(jī),傳輸業務數據。采用2台H3C全萬兆交換機(jī)作(zuò)爲存儲交換機(jī)來(lái)下聯服務器、超融合數據複制,來(lái)傳輸虛拟化平台基礎數據。采用1台H3C作(zuò)爲帶外管理(lǐ)交換機(jī)來(lái)遠(yuǎn)程管理(lǐ)本項目所有硬件(jiàn)設備 展開
![](static/picture/92.png)
虛拟化
- 在所有服務器上部署H3C的超融合平台,對計(jì)算及GPU資源進行池化資源管理(lǐ)
![](static/picture/10.png)
雲管理(lǐ)平台
- 在虛拟化平台上部署H3C雲平台軟件(jiàn),對所有服務器進行雲數據中心管理(lǐ)
![](404.png)
方案優勢
超融合管理(lǐ)平台基于多角色集群引擎打破了物理(lǐ)資源壁壘,以其自(zì)适應架構,不僅可(kě)以統一管理(lǐ)X86資源池和ARM資源池,還(hái)可(kě)以同時管理(lǐ)純虛拟化節點、純分(fēn)布式存儲節點、超融合節點、AI加速節點、裸金屬節點等。
兼容不同芯片、不同款型、不同配置、不同能力的物理(lǐ)節點。
實現了硬件(jiàn)資源高度集約的同時,保證了集群操作(zuò)的一緻性,實現了異構式的硬件(jiàn)資源池,大(dà)大(dà)豐富了應用場景。
客戶收益