英特爾

告別2022年,兩大x86伺服器處理器廠商曾在11月交鋒,在SC22年度超級電腦大會前夕,爭相發表最新平臺,而這一波產品發表戰局仍將在今年陸續開打。

在11月2日,英特爾發布新聞的推特帳號Intel News預告,1月10日將舉行資料中心發表會,當中將包含第四代Xeon Scalable系列處理器。

一週之後,他們搶先於11月9日公開(introduce)Intel Max系列產品線,當中包含伺服器處理器Xeon CPU Max系列(代號為Sapphire Rapids HBM),宣稱有12家廠商響應號召,提供超過30款系統設計,以寬鬆的標準來看,英特爾算是實現他們年初提出的2022 Sapphire Rapids上市承諾。

但尷尬的是,那段期間僅有少數伺服器廠商對此發布新聞稿(例如Supermicro),談到他們未來將會推出搭配這系列處理器的機型,而且,Sapphire Rapids HBM畢竟是針對高效能運算市場的產品,並未涵蓋到一般用途的需求,因此,嚴格來說,Sapphire Rapids這整張牌還是只掀開了一些,全貌仍不夠清晰。

而在11月10日,AMD宣布推出第四代EPYC伺服器處理器平臺(10月24日預告11月10日將舉行次世代資料中心處理器發表會),雖然比Intel Max系列發表晚了一天,就產品發表會聲勢與合作業者表態支持程度而言,卻明顯勝出一籌。

多家主要雲端服務業者與伺服器廠商紛紛派出公司高層,透過預錄影片祝賀或親自到AMD發表會站臺,也在這個活動場合率先宣布採用這個處理器平臺的最新執行個體服務,或是新世代伺服器機型,不僅以此拉抬處理器廠商聲勢,也趁機幫自家產品和服務打廣告。

到了12月22日,英特爾正式公告2023年1月10日舉行產品發表會,屆時將推出(Launch)第四代Xeon Scalable系列處理器平臺(代號為Sapphire Rapids),以及Max系列CPU與GPU。

然而,那時正值歲末年終,已接近全球歡度2022耶誕節與2023新年假期,整個IT界的注意力這段期間都落在國際消費電子大展(CES)相關消息,對於新一代處理器的發展,也往往聚焦在個人電腦平臺,多數人並未預期此時會有新一代伺服器平臺的重大發表。

回顧英特爾過去幾代伺服器處理器平臺的發表時機,第一代Xeon Scalable是在2017年7月登場,第二代Xeon Scalable在2019年4月,第三代Xeon Scalable在2021年4月,第四代Xeon Scalable竟選在CES大展隔週正式推出,算是創下首例。

這款處理器平臺發表時間出乎眾人意料之外的另一個原因,在於產品上市時程一延再延。

早在第三代Xeon Scalable上市之前,英特爾就開始宣傳Sapphire Rapids;到了2021年舉行的架構日,他們首度以完整而有系統的方式公開介紹其技術架構與市場競爭優勢;在2022一整年的多場大型公開活動中,英特爾預告2022、2023、2024這三年將陸續推出Sapphire Rapids、Emerald Rapids,以及Granite Rapids與Sierra Forest等三個世代的Xeon處理器確認Sapphire Rapids就是第四代Xeon Scalable,但外界還是搞不清楚2022年何時推出Sapphire Rapids。

關於Sapphire Rapids可能上市的時間,英特爾過去曾提出不同說法,一度讓大家以為大幅超前,可惜最終還是拖到2023年1月10日才算是正式登場。

例如,在2020年舉行的架構日活動中,他們表示預計於2021年下半開始生產;在2022年2月的公司投資者大會上,英特爾高層表示3月開始出貨;同年5月舉行的Vision 2022,以及9月舉行的Innovation 2022這兩場全球用戶大會期間,英特爾雖然持續介紹Sapphire Rapids的各項特色,但並未再提起產品正式發表時間,之後英特爾於12月在臺舉行Intel Sustainability Taiwan Day,現場雖然找來一些伺服器廠商展示搭配第四代Xeon Scalable的產品與周邊延伸解決方案,但我們仍不知到底何時要正式推出,僅隱約感覺上市時間越來越近。

直到2023年1月初,我們收到一家伺服器廠商對臺灣媒體的新聞稿預告通知,才真正意識到這款伺服器處理器平臺終於要發表了。

找來更多合作廠商助陣,展現長期耕耘伺服器市場的實力

在SC22大會以線上預錄影片發表Max系列CPU與GPU時,英特爾當時可能是希望聚焦在高效能、機器學習等超級運算應用,僅列出採用此平臺的12家伺服器業者廠牌,前來亮相站臺的用戶案例是隸屬美國能源部的阿貢國家實驗室。到了2023年1月舉行的第四代Xeon Scalable系列與Max系列發表會,英特爾號召多家合作廠商與用戶,祝賀其推出產品,一展更勝於競爭對手的市場號召力。

以伺服器廠商而言,Dell Technologies、浪潮、HPE聯想CiscoSupermicroFujitsu等公司,都派出副總裁、甚至執行長等級的公司高層,而在資料中心GPU市場與英特爾競爭的Nvidia,也因為新一代AI整合應用設備採用處理器的關係,而首度以預錄影片的形式出現在英特爾的伺服器發表活動。

    

    

  

全球大型雲端業者與伺服器代管服務商,也都派出公司高層向英特爾祝賀新產品上市,例如,AWS微軟Azure、Google Cloud、Oracle Cloud、IBM Cloud、Dropbox、CoreWeave,以及IONOS、phoenixNAP、OVHcloud。

    

    

    

  

在電信網路業者方面,有Ericsson、西班牙電信(Telefónica);在高效能運算領域應用上,則以美國能源部洛斯阿拉莫斯國家實驗室作為代表。

    

至於英特爾長期合作的商業軟體廠商的部分,有Cloudera、Red Hat、SAP、VMware,涵蓋大數據、作業系統、企業關鍵應用系統等領域。

  

  

推出52個款式,最多提供60顆核心,每瓦效能提升至2.9倍

關於兩大廠商近期新一代伺服器處理器平臺上市策略,很難比出高下,但若要嚴厲批判,共通點就是都採「擠牙膏」的方式推出產品。早一步於去年11月推出的AMD第四代EPYC處理器9004系列,嚴格來說,只能算是這一代資料中心產品發表的第一波,雖然僅提供18個款式的選擇,但後續還有三波產品發表。

過去經常受到這樣批評的英特爾,原本有機會讓大家改觀,一口氣發表兼具突破性效能與支援多種最新技術的伺服器平臺,遺憾的是,第四代Xeon Scalable處理器的主要發表活動,最後竟分成數次進行,所幸遲至2023年1月正式推出的第四代Xeon Scalable處理器,產品的完整樣貌、細部規格大部分皆已浮上檯面,而對於能進一步加速處理5G核心工作負載的vRAN Boost,英特爾稍晚將會額外推出內建此技術的產品。

以對應不同工作負載需求的選擇而言,英特爾為第四代Xeon Scalable處理器,洋洋灑灑提供52個款式(包含Xeon CPU Max系列),數量與第一代、第二代Xeon Scalable相當,在應用市場區隔上,可分為10種,以應用形式而言,涵蓋7大類:一般用途、長期使用/物聯網、記憶體內資料庫/大數據分析/虛擬化最佳化、5G/網路最佳化、雲服務最佳化、儲存與超融合基礎架構最佳化、高效能運算最佳化,而在一般用途當中,細分為2路高效能、2路主流、液態冷卻、單路。

值得注意的是,Xeon Scalable處理器過去三代區分的4大品牌系列:Xeon Platinum(9000系列與8000系列)、Xeon Gold(6000系列與5000系列)、Xeon Silver(4000系列)、Xeon Bronze(3000系列),到了最新發表的第四代,將9000系列獨立為新品牌:Xeon Max,也就是2022年11月登場的超級運算產品之一,對應上述的高效能運算最佳化應用款式。

根據英特爾公布的規格來看,第四代Xeon Scalable最多可提供60顆運算核心、120個執行緒,熱設計功耗(TDP)最高為350瓦。相較之下,第三代Xeon Scalable最多可提供40顆運算核心、80個執行緒,熱設計功耗最高為270瓦。

以產品內部配置而言,第四代Xeon Scalable處理器分為通用型與高效能運算型(如左圖的對比),差異在於高效能運算型額外內建HBM2記憶體,在嵌入式多晶片互連橋接(EMIB)之上,以模組化晶粒交織網路(MDF)連接4片晶磚(如上圖最右側),通用型則提供這類晶片及單體晶片等兩種設計,實現超多顆核心(XCC)與中量核心(MCC)。圖片來源/英特爾

由於效能與耗電量增加已是新一代伺服器處理器必然發展的趨勢,設法提高能源使用效率也成為眾人關注焦點,為此英特爾也特別強調發表第四代Xeon Scalable具有這方面的特色。

首先,就每瓦效能的表現而言,若用於鍵值資料庫系統RocksDB的工作負載,以搭配2顆40核心第三代Xeon Scalable處理器系統為準,搭配2顆60核心第四代Xeon Scalable處理器的伺服器,可達到2.9倍。

而且,英特爾在第四代Xeon Scalable增加了最佳省電模式(Optimized Power Mode),若啟動這項模式,就能以效能折損最少的狀態執行特定工作負載,以每顆處理器而言,平均耗電量可節省70瓦。舉例來說,若用於SPECjbb、SPECint等效能測試,以及Nginx網站金鑰交握的處理,第四代Xeon Scalable啟用這項模式之後,執行這些工作負載影響效能的幅度低於5%,但節省系統耗電量可達到20%。

在此同時,想要提升伺服器省電成效,能否具備更完善的遠端狀態監控能力也是關鍵,因為難以量測的東西是無法管理的(You Can't Manage What You Don't Measure),為此歷代Xeon處理器都支援或內建遙測機制,可協助提供重要的資料與AI處理能力,以便更聰明地進行CPU資源監控與管理、建立可預測資料中心或網路流量尖峰負載的模型,並且能在處理需求降低時,自動調校CPU時脈以節省電力,進而縮減資料中心的碳足跡。

而在第四代Xeon Scalable處理器當中,英特爾針對這部分需求添加新的框架,稱為平臺監控技術(Platform Monitoring Technology,PMT),可透過處理器核心溫度、耗電量,以及作業系統端所收集的處理器執行狀態等資訊的揭露與掌控,提供更理想的遠端監測能力。英特爾副總裁暨資料中心平臺工程與架構事業部總經理Zane A. Ball表示,PMT已用於他們內部的大規模測試設施驗證過程,以此收集數GB的遙測資料,可涵蓋頻內(in-band)、頻外(out-band)管理應用,甚至在無需重新啟動作業系統的狀態下,進行韌體更新,英特爾也更新相關的除錯工具,可用於遠端診斷與解決問題,能揪出那些在統計數字邊緣的罕見或偶發狀況。

除此之外,英特爾對氣冷與液冷機制提供了創新設計,以便更進一步減少資料中心消耗的能源。而在生產製造這一代Xeon Scalable處理器的過程中,英特爾也做出示範,強調在自家廠區採用90%以上的可再生電力,搭配先進的水資源回收設施。

而以總體持有成本(TCO)而言,英特爾表示,比起搭配第三代Xeon Scalable的系統,搭配第四代Xeon Scalable的系統在成本開支的降低幅度,可達到52%到66%。舉例來說,用於資料庫的TCO降幅為52%,用於AI即時推論的TCO降幅為55%,用於高效能運算的TCO降幅為66%。

關於運算效能增長的部分,本次發表第四代Xeon Scalable系列的消息當中,最吸睛的是AI方面的應用,受益於處理器晶片內建「進階矩陣延伸(Advanced Matrix Extension,AMX)」加速器,在PyTorch即時推論與訓練處理中,最大可獲得10倍的提升。若面對大型AI語言模型處理類型的工作負載,搭配Xeon Max系列可提供20倍的加速效能。

針對HPC與5G網路伺服器建置需求,增添提升性能的強化配備

前面提到第四代Xeon Scalable目前區分為10種用途,有些專攻特定應用領域,規格具有與其他款式顯著不同之處。

例如,專攻高效能運算市場的產品,主要是Xeon Max 9400系列,英特爾這次發表公布5種款式與細部技術規格,除了具備AMX等諸多共通規格,Xeon Max目前全都配備64 GB容量的HBM2高頻寬記憶體。而在運算性能的表現上,相較於第三代Xeon Scalable,Xeon Max在能源、地球系統建模等實務應用系統當中,可提供3.7倍的效能。

除了AI與HPC,英特爾也針對網路與邊緣運算的高效能、低延遲工作負載需求,在第四代Xeon Scalable提供一系列產品,可廣泛用於電信通訊、零售、製造、智慧城市等領域,以此作為協助整個產業實現軟體定義架構的重要基石。

以5G網路服務核心工作負載的執行而言,第四代Xeon Scalable內建加速技術,具有提升資料吞吐能力、降低存取延遲,以及進步的耗電量管理等特色,能強化整個平臺的反應速度與運作效率。

若就虛擬無線存取網路(vRAN)的應用而言,英特爾曾在2022年2月的世界行動通訊大會(MWC Barcelona 2022)預告,Sapphire Rapids將新增5G專用的信號處理指令強化,可望將負載容量提升至第三代Xeon Scalable處理器系統的2倍,而且會提供整合加速vRAN工作負載執行技術的Sapphire Rapids處理器。

而這項功能特色就是,第四代Xeon Scalable新內建的AVX-512 for vRAN延伸指令集,能夠補足Xeon處理器既有的32位元與64位元浮點指令集,可支援16位元半精度浮點運算(FP16),用於需要減低計算精度的作業,像是通訊信號與傳播媒介的處理。以無線通訊信號為例,如波束成形(beamforming)、預先編碼(precoding)、最小均方誤差(MMSE),均可善用AVX-512 for vRAN加速處理,促使通用平臺(GPP)在相關操作的效率上,能與搭配數位訊號處理器的專屬設備一較高下。

根據英特爾以核心數量、耗電量、時脈相近的兩代處理器、執行FlexRAN軟體進行測試,搭配第四代Xeon Scalable系統的負載容量,可達到搭配第三代Xeon Scalable系統的兩倍,而且不會因此增加耗電量;換言之,當通訊服務業者在導入這樣的運算平臺時,可望獲得兩倍的每瓦效能,從而符合他們對關鍵效能、規模擴展、能源使用效率等層面的要求。

如果用戶需要節省更多電力與更強的vRAN加速處理能力,第四代Xeon Scalable後續將提供內建vRAN Boost技術(整合vRAN加速晶片)的款式。而在2月6日,英特爾明確公告這系列產品發表時間,該公司網路與邊緣事業群技術長暨策略長Sachin Katti表示,內建vRAN Boost的第四代Xeon Scalable處理器,即將在月底舉行的2023世界行動通訊大會(MWC Barcelona 2023)正式推出,屆時將與他們幾個最大客戶一起亮相。

根據英特爾的情境設計耗電量分析評估,在相同的核心數量與時脈之下,搭配這種特殊款式處理器的系統,比起搭配一般第四代Xeon Scalable,可進一步節省將近20%耗電量,提供更出色的每瓦效能,幫通訊服務業者省下更多電力,而無須搭配外部vRAN加速卡的設計,也減少OEM廠商的物件清單管理成本。 

  

內建6大硬體加速,支援AI、分析、網路、資安、儲存應用

在第四代Xeon Scalable處理器的發展過程中,隨著英特爾從2021年積極主打新一代垂直整合製造模式,也就是IDM 2.0策略,這兩年來,他們更加著重宣傳產品設計與製造實力的展現上。

以伺服器處理器平臺的產品而言,他們陸續提到將採用Intel 7製程運算晶磚(Compute Tiles)、嵌入式多晶片互連橋接(EMIB)封裝,實現不同的模組化設計,同時,也將支援DDR5記憶體、PCIe 5.0系統I/O介面,以及CXL 1.1互連介面等多種先進的周邊規格。

單就次世代Xeon Scalable內部組成架構而言,其實,也導入多種新的硬體元件設計。

  

舉例來說,在2021架構日,英特爾特別介紹幾個重要特色,像是搭配高效能核心(Performance Core,P-core),可縮短存取延遲與提升伺服器端的單執行緒應用程式效能。

相較於2021年10月發表的個人電腦處理器第12代Core系列(代號為Alder Lake),率先搭配代號為Golden Cove的高效能核心,新一代Xeon Scalable系列伺服器處理器同樣採用Golden Cove核心,但額外提供新的矩陣乘法運算引擎,也就是前述的AMX,是2020年架構日就預告推出的加速功能之一。

  

而在處理器核心之外,英特爾還為其增添多種加速器引擎。於2021架構日與Hot Chips年度大會,他們先介紹最初同樣在2020年架構日就預告的資料串流加速器(DSA);接著是英特爾發展多年的Quick Assist Technology(QAT),可提升資料加密與壓縮處理速度,過去已透過多種形式提供,例如,獨立加速卡、系統晶片組,或內建於Xeon D系列、Atom系列處理器等;另一個則是該公司過去從未提到的動態負載平衡(Dynamic Load Balancing,DLB)加速器,能以動態、平均的方式,將工作負載分配到各個核心執行,提升運算效率。

  

  

  

同年9月舉行的Intel Innovation大會期間,英特爾突然介紹與展示第四代Xeon Scalable內建的另一個加速器,名為記憶體內分析加速器(In-Memory Analytics Accelerator,IAA),號稱能以較低的記憶體頻寬來提升資料庫執行效能,可用於一般資料庫系統、記憶體內資料庫(In-Memory Database,IMDb)、大數據分析系統、資料倉儲系統。

在此同時,英特爾於2月介紹的處理器內建vRAN加速技術,9月也終於公布正式名稱,叫做vRAN Boost,他們預告2023年將推出內建這項加速器的第四代Xeon Scalable處理器,而這項加速技術的源頭,其實原本是一張用於vRAN前導錯誤校正(FCC)加速的專屬介面卡,名為,Intel vRAN Dedicated Accelerator ACC100,如今以硬體加速器元件的形式融入Xeon Scalable處理器。

    

到了2023年1月,第四代Xeon Scalable正式登場,英特爾宣布產品添加強化伺服器資安防護的加速器,稱為信任網域延伸(Trust Domain Extensions,TDX),提供新的虛擬機器隔離技術,能將既有應用程式移植到機密環境執行,實際運用方式預計會在幾家大型公有雲業者展現,微軟Azure與IBM Cloud均發表部落格文章談及這項工作,英特爾表示,阿里雲、Google Cloud也將支援。

  

在安全性防護方面的改進上,英特爾第四代Xeon Scalable另一個令人期待已久的特色,是終於內建控制流強制技術(Control-Flow Enforcement Technology,CET),能透過複製由處理器代管的影子堆疊(shadow stack),再將其比較正在執行的堆疊程序呼叫,確保不會出現意料之外的差異,以此對抗回傳記憶體位址導向的程式設計(Return-Oriented Programming,ROP)。

CET其實早在2020年推出的個人電腦處理器第11代Core(代號為Tiger Lake),英特爾就已經開始提供,如今在伺服器處理器Xeon Scalable也具備這方面的防護能力。

熱門新聞

Advertisement