HPE憑藉全堆疊AI架構，讓企業加速踏上AI應用旅程

近年來伴隨生成式AI爆紅、影響力迅速擴散至各行各業，驅使許多企業逐漸意識到需要引入全新的資料與運算技術方法，才能更有效地運行AI模型。著眼於此，HPE於去年底（2023）推出嶄新的開放式全堆疊AI原生架構，其中蘊含了足以加速AI生命週期的軟體與基礎架構，以協助企業突破重重障礙，能夠在從邊緣到雲端之間執行高效率的AI模型訓練、調校和推論工作。

綜觀HPE的全堆疊AI解決方案，由下而上，涵蓋基礎架構、中介軟體、AI/ML訓練平臺、整合系統／即服務、解決方案等五大層次。以當中至關重要的AI/ML訓練層而論，裡頭涵括HPE機器學習開發環境、Pachyderm AI流程管理平臺、SmartSim模擬系統、HPE群體學習（HPE Swarm Learning）、HPE Ezmeral Unified Analytics軟體；其中HPE機器學習開發環境可提供全新的生成式AI工作室功能，幫助用戶加速建立原型與測試模型，至於HPE Ezmeral軟體則內含GPU感知功能，一來可協助用戶簡化部署，二來還能加速混合雲AI工作負載的資料準備。

至於另一個關鍵層次，無疑正是專為AI打造且最佳化的基礎架構層，箇中涵蓋做為中高端AI訓練和推理定位（企業AI/HPC）的HPE ProLiant DL380a Gen11，做為超高端HPC的HPE Cray Supercomputing，乃至於HPE SimpliVity 380 Gen10 Plus超融合系統等主力機種。

DL380a Gen11專為AI而生，可承擔中高端訓練與推理

先從HPE ProLiant DL380a Gen11開始說起。該主機與另一款熱門伺服器「ProLiant DL380 Gen11」命名相似，僅有「a」一字之差，但不論細部規格或適用的工作負載，彼此都有不小差異。

ProLiant DL380 Gen11定位在一般General-purpose伺服器，適合承載傳統企業工作負載、小規模運算等工作任務，主要以企業為中心。反觀ProLiant DL380a Gen11，則適合承擔中高檔訓練、中高範圍推理、GPU運算密集型工作負載等任務，能夠支援深度學習訓練與推論、智慧影像分析（IVA）等多種應用，以企業AI為重點。

關於PCIe擴充部份，ProLiant DL380a Gen11可裝載4張全高半長介面卡，現階段能夠搭配4張雙寬尺寸或8張單寬尺寸的GPU，像是NVIDIA H100 80GB PCIe5（雙寬尺寸、TDP為350W）、NVIDIA L40/L40S 48GB PCIe4（雙寬尺寸、TDP為300W／350W）、NVIDIA L4 24GB PCIe4（單寬尺寸、TDP為72W），以及Intel Data Center GPU Max 1100 48GB PCIe5（雙寬尺寸、TDP為300W）。

HPE Proliant DL380a Gen11 專為AI而生

值得留意的是，大多數伺服器若要搭載PCIe板卡形式的GPU，經常配置於機箱的後半段，比方說ProLiant DL380 Gen11便是如此設計。然而DL380a Gen11則是把GPU配置在機箱前段的左右兩側；深究其因，這樣的配置模式具有幾個相對優勢，譬如機箱前段的進氣溫度較低，有利於GPU散熱，或是可以避開機箱後段PCIe橫向擴充卡的空間限制，能夠增加GPU安裝數量，總括來說可以優化氣流並增加GPU密度，同時為每張GPU卡提供專屬的電源供應器，進而延長GPU的工作時間。

更重要的，ProLiant DL380a Gen11有能力配置GPU橋接器，如NVIDIA Ampere 2-way 2-slot Bridge for HPE，藉由NVLink介面連接兩張PCIe板卡形式的H100；或是Intel XeLink x2 Bridge，藉此連接兩張Intel Data Center GPU Max 1100，而一般伺服器少有類似佈局。擁有GPU橋接器的情況下，最大好處便是提升GPU間的雙向存取能力，從增加GPU吞吐率並支援跨GPU的記憶體共享，對於提高效能或優化資源利用率，皆有顯著助益。

支援DLC的Cray超級電腦，讓高效能與ESG兼得

接著談到HPE Cray Supercomputing，主要焦點落在XD系列超級電腦（含4U的XD665、5U的XD670）。環顧超級電腦發展史，算是罕見擁有小體積、親民價位、強效節能等多重利基的獨特產品，可望促使更多企業投入超級運算技術，順勢取得Exascale百萬兆級強大效能、大規模AI模型（AI-at-scale）功能，更游刃有餘地處理資料密集型且高效能需求的工作負載，從而以最快速度獲得洞察力、解決問題與進行創新。

其中XD665可承載4張NVIDIA H100 80G SXM GPU加上2顆AMD Genoa CPU，適用於混合CPU／GPU的應用情境，像是全連接稀疏資料集（如推薦器）、依順序的ML工作（如RNN或時間序列資料）、處理高端HPC CPU及GPU模擬工作量，或是涉及圖神經網路（GNN）、地理空間的應用場景。此外它也適用於小型模型或遷移學習，譬如LLAMA或PocketLLM等大型語言模型（LLM）、用於概念驗證（PoC）及快速定製的遷移學習。

而XD670可承載8張NVIDIA H100 94G SXM GPU加上2顆Intel Sapphire Rapids CPU，擅於支持GPU密集型或高度可並行化的LLM或DL任務，比方說氣候建模、基因組學、萊迪思QCD、8K 3D FFTs2，或用於模型訓練／重新訓練／關鍵部署時、當任務高度平行化時。另外它亦適用在訓練超大尺寸模型或「從頭開始」訓練的場景。值得一提， XD670支援直接液冷（Direct-liquid Cooling；DLC）散熱方式，有助提高能源效率，這對於既想推升AI運算效能、又想減少碳足跡的企業組織來說，確實具有莫大誘因。

最後論及HPE SimpliVity 380 Gen10 Plus，相比於一般SimpliVity 380超融合系統，可支援更多的GPU選擇，以及能承載更大量的記憶體，故定位於高效能機種，更加勝任AI訓練工作負載。

綜觀SimpliVity 380 Gen10 Plus能夠支援的GPU，大致落在基於NVIDIA Ampere架構的A16、A40或A30，其中A30支援三款產品中最大的記憶體頻寬933.1GB/s，可營造165 TFLOPS算力，適用於像是天文物理模擬、有限元素法模擬等應用場景。

歡迎參加: 敦新科技於3月20日於精誠科技講堂舉辦線上AI講座，主題為【 HPE智慧時代啟程：AI導入關鍵指南】，敬請報名，免費參加，並有抽獎活動。

報名參加:請按此

身為HPE伺服器及儲存設備代理商的敦新科技，提供IT投資解決方案幫助您轉型為數位化業務，最新機種及服務歡迎洽詢: 0800-072-636。

了解更多 : 敦新科技

熱門新聞