數據中心資源池

數據中心資源池解決方案是一種将數據中心的物理(lǐ)資源(如(rú)服務器、存儲、網絡)進行虛拟化和統一管理(lǐ)的技術(shù)方案,它可(kě)以實現資源的動态分(fēn)配和優化,提高資源的利用率和效率,降低資源的成本和風(fēng)險。

背景

某計(jì)算中心是國(guó)家重點研發計(jì)劃的重要組成部分(fēn),中心需要建設一個CPU與GPU混合算力集群平台,以支持中心的研究項目和應用需求,提高中心的計(jì)算能力和效率。

需求分(fēn)析

01.

構建卓越集群平台

集群平台應具備高性能、高可(kě)靠、高可(kě)擴展、高安全的特點,能夠滿足中心的各類計(jì)算任務的需求,包括高性能計(jì)算、大(dà)數據分(fēn)析、深度學習、圖像處理(lǐ)等。

02.

混合架構卓越表現

集群平台應采用CPU與GPU混合的架構,利用CPU的通用性和GPU的并行性,實現高效的計(jì)算加速。集群平台應支持多種類型的GPU,包括英偉達、寒武紀等,以适應不同的計(jì)算場景和需求

03.

卓越通信架構

集群平台應具備良好的網絡通信能力,采用高速、低延遲、高帶寬的網絡設備,實現節點間的高效數據傳輸和協同計(jì)算

04.

全面運維解決方案

集群平台應具備完善的管理(lǐ)和監控功能,采用統一的管理(lǐ)軟件(jiàn),實現集群的配置、調度、監控、故障處理(lǐ)等功能,提高集群的運維效率和可(kě)用性

05.

雲端多租戶管理(lǐ)

集群平台雲管理(lǐ)功能,支持多租戶管理(lǐ),并能夠納管裸金屬服務器

方案描述

服務器


  • 采用H3C R4900G5作(zuò)爲通用服務器、高性能服務器和國(guó)外GPU x86服務器載體(tǐ),搭配不同性能的CPU來(lái)提供相(xiàng)應的計(jì)算性能。采用飛騰服務器作(zuò)爲信創服務器及國(guó)産GPU載體(tǐ)。國(guó)外顯卡部署在2台通用GPUx86服務器上,而2塊國(guó)産顯卡部署在飛騰服務器上

網絡


  • 采用2台H3C全萬兆交換機(jī)作(zuò)爲業務交換機(jī)來(lái)上聯服務器與核心交換機(jī),傳輸業務數據。采用2台H3C全萬兆交換機(jī)作(zuò)爲存儲交換機(jī)來(lái)下聯服務器、超融合數據複制,來(lái)傳輸虛拟化平台基礎數據。采用1台H3C作(zuò)爲帶外管理(lǐ)交換機(jī)來(lái)遠(yuǎn)程管理(lǐ)本項目所有硬件(jiàn)設備

虛拟化


  • 在所有服務器上部署H3C的超融合平台,對計(jì)算及GPU資源進行池化資源管理(lǐ)

雲管理(lǐ)平台


  • 在虛拟化平台上部署H3C雲平台軟件(jiàn),對所有服務器進行雲數據中心管理(lǐ)

方案優勢

超融合管理(lǐ)平台基于多角色集群引擎打破了物理(lǐ)資源壁壘,以其自(zì)适應架構,不僅可(kě)以統一管理(lǐ)X86資源池和ARM資源池,還(hái)可(kě)以同時管理(lǐ)純虛拟化節點、純分(fēn)布式存儲節點、超融合節點、AI加速節點、裸金屬節點等。

兼容不同芯片、不同款型、不同配置、不同能力的物理(lǐ)節點。

實現了硬件(jiàn)資源高度集約的同時,保證了集群操作(zuò)的一緻性,實現了異構式的硬件(jiàn)資源池,大(dà)大(dà)豐富了應用場景。

客戶收益

UIS雲平台支持對虛拟化、裸金屬等異構資源統一管理(lǐ)

支持基于裸金屬服務器的容器實例部署,基于裸金屬部署大(dà)數據服務

裸金屬和雲主機(jī)統一資源池化管理(lǐ)

通過H3C UIS超融合管理(lǐ)軟件(jiàn)集成的數據安全隔離(lí)功能,确保虛拟化、多租戶環境下的用戶隐私信息及數據的安全。不同組織的業務系統和應用系統獨立部署,互不幹擾

支持GPU資源池功能,根據設置的業務模闆及資源搶占策略,實現對GPU資源的自(zì)動分(fēn)配和回收