每年定期於6月和11月舉行的兩場全球超級電腦大會期間,向來是各大運算平臺廠商展現自家產品與技術實力的重要時刻,以便招攬高效能運算市場的客戶,今年也不例外,英特爾(Intel)在2022上半陸續召開的投資者大會、Vision用戶大會,以及歐洲國際超級電腦大會ISC 2022,揭露最新一代的伺服器處理器、資料中心GPU的最新發展,並於11月9日正式發表他們的超級運算產品線Max系列CPU與GPU;身為x86伺服器處理器的另一大競爭廠商超微(AMD),今年也持續發布相關消息,例如,3月正式推出內建3D V-Cache技術的第3代EPYC處理器(代號為Milan-X),以及Instinct MI210資料中心GPU;4月併購分散式服務平臺/資料處理器廠商Pensando,5月底全球500大超級電腦揭曉最新排行,奪得第一的橡樹嶺國家實驗室(ORNL)Frontier系統,裡面採用了優化的AMD第3代EPYC處理器,以及資料中心GPU產品Instinct MI250x;6月AMD在自家財務分析師大會上,介紹即將登場的第四代EPYC處理器最新陣容,以及上市時程。
到了10月底,AMD預告11月11日舉行新一代EPYC處理器的線上發表會,而主角正是最早對外公布、後續定於第四季推出的通用伺服器處理器系列,代號為Genoa,正式名稱為EPYC 9004系列處理器,提供18款晶片的選擇,核心數量為16顆、24顆、32顆、48顆、64顆、84顆、96顆,L3快取記憶體容量為64 MB、128 MB、256 MB、384 MB,並且支援AVX-512指令集,可涵蓋BFLOAT16、VNNI指令的處理,加速人工智慧與機器學習應用系統的執行,
而在熱設計功耗(TDP)的規格上,區分為200瓦、210瓦、280瓦、290瓦、320瓦、360瓦等配置,可設定熱設計功耗為(cTDP)為200至240瓦、240至300瓦、320至400瓦。
關於記憶體與I/O規格的部分,EPYC 9004系列支援DDR5-4800記憶體,能夠以12通道方式進行存取,記憶體容量最大可支援6 TB,而在介面擴充方式上,可支援PCIe 5.0,能以128個通道進行存取,而對於今年下半開始走紅的CXL記憶體擴充介面,這系列處理器也支援1.1版以上的規格,能以64個通道進行存取。
導入新製程、支援新規格,強調以少代多的高能耗效益
在早先AMD公開的伺服器CPU發展藍圖中,接替第三代EPYC系列(代號為Milan)的第四代EPYC系列,最初就是代號為Genoa的產品,標榜採用5奈米製程,在去年11月發表Milan-X處理器與Instinct MI200資料中心GPU之際,AMD初步介紹Genoa的規格,例如,最多可提供96顆Zen 4架構核心,支援DDR5記憶體,以及PCIe 5.0、CXL等I/O與記憶體擴充介面。
而在11月的線上發表會,AMD董事長暨執行長蘇姿丰公布更多第四代EPYC系列的特性,例如,提供96顆5奈米製程的Zen 4架構核心,採用他們發展的新一代小晶片(Chiplet)技術,當中也結合5奈米與6奈米製程技術,並且添加PCIe 5.0介面、12通道的DDR5記憶體、CXL記憶體擴充等新型I/O技術,而在機密虛擬機器的承載能力也提升至2倍。
她表示,這裡面有12個運算晶粒,都是採用5奈米製程而成,提供所有的處理器核心,位於晶片中間的I/O晶粒則是基於6奈米製程技術而成,整顆處理器總共使用了9千億顆電晶體;
而在效能表現上,同樣都是2路伺服器的架構,AMD第三代EPYC處理器7763(提供64核心,熱設計功耗為280瓦)的效能,超越了競爭廠商英特爾伺服器平臺頂級處理器Xeon Platinum 8380(提供40核心,熱設計功耗為270瓦),領先幅度為40%(SPECrate 2017整數運算測試)。
基於多達96顆運算核心的第四代EPYC系列,蘇姿丰表示,雲端服務業者在每臺伺服器能夠提供2.4倍的執行個體規模(此處應該是對應Intel第三代Xeon Scalable系列最多可提供40顆核心而言),就每臺虛擬機器而言,可獲得1.24倍的整數運算效能。
關於涉及複雜的AI建模、科學研究的高效能運算領域,AMD現行的第三代EPYC系列,浮點運算效能領先競爭廠商產品幅度僅10%,但到了第四代EPYC系列,浮點運算效能有了長足的進步,達到競爭廠商產品的2.5倍,可協助科學家建立更精準的模型、解決更大的科學挑戰,像是氣候變遷、能源開發、醫學研究。
而在企業應用方面,以電子商務領域常用的Java而言,AMD第三代EPYC系列的效能,領先競爭廠商產品的幅度為50%,到了第四代EPYC系列,效能有了明顯增長,達到逼近競爭產品的3倍;若是涉及大量交易、分析、決策支援的資料庫,第四代EPYC系列的中位數查詢每小時處理效能,則是競爭產品的2.7倍。
在能源使用效益上,若以去年每小時千瓦的電力平均費率為0.08美元為基礎,企業通常在單臺機櫃置入15臺搭載Xeon Platinum 8380的伺服器,如此配置1年下來需耗費超過8,400美元,若改用第三代EPYC系列之後,僅需10臺伺服器就能承擔同樣的工作負載,所需費用降低了32%。而在特定國家地區,今年面臨能源價格高漲至去年5倍的壓力,以每小時千瓦的成本為0.46美元為準,同樣是單臺機櫃置入15臺搭載Xeon Platinum 8380的伺服器,全年費用達到近5萬美元的程度,若改用第四代EPYC系列,憑藉5臺伺服器即可負擔其效能需求,成本降低幅度達到54%。對此,蘇姿丰當然不忘宣傳升級與更換平臺的必要性與可行性,她說,若放眼企業需同時維運數千臺伺服器的狀況而言,可想而知,能省下數百萬美元來升級第四代EPYC。
而這樣的論調,正是AMD本次EPYC處理器發表會的重點。他們強調憑藉單顆處理器可提供96顆核心,用戶僅需部署更少的高性能伺服器,就能持續滿足運算需求。事實上,第四代EPYC系列對伺服器設計將帶來不小的改變,而這些是AMD並不想在檯面上多加描述的部分;首先,EPYC 9004系列處理器插槽改為SP5(LGA 6096),在此之前,從EPYC 7001系列到7003系列,插槽都是SP3(LGA-4094);第二,熱設計功耗範圍,EPYC 9004系列處理器為200瓦到400瓦,而EPYC 7001系列與EPYC 7002系列是120瓦到200瓦,EPYC 7003系列是155瓦到280瓦。顯然無論如何,所有採用新一代AMD EPYC平臺的伺服器廠商,勢必要重新設計主機板與機箱冷卻配置。
無獨有偶,英特爾尚未「完全」發表的第四代Xeon Scalable系列處理器(代號Sapphire Rapids),也有類似現象,處理器插槽應該會採用FCLGA 4677,在此之前,Xeon Scalable系列的第一代與第二代為FCLGA3647,第三代FCLGA4189;在熱設計功耗方面,搶先於SC22大會前夕亮相的Intel Xeon CPU Max系列(代號為Sapphire Rapids HBM),英特爾表示該款CPU為350瓦,相較之下,在現行的Xeon Scalable系列當中,第三代的熱設計功耗最高為270瓦,第一代與第二代最高為205瓦(9282、9242、9221、9222例外,分別為400瓦、350瓦、250瓦)。因此,廠商若要推出採用第四代Xeon Scalable的伺服器,也同樣需要重新設計主機板與機箱冷卻配置。
微軟、甲骨文、GCP等雲端業者助陣、多家伺服器廠商簇擁,展現市場號召力
在11月11日舉行的第四代EPYC處理器線上發表會,AMD公布重要規格與多種效能測試數據的比較之餘,多家合作廠商的高層主管出面為其站臺、宣布基於此款處理器的雲端服務與伺服器機型,也是穿插在整場活動當中的重頭戲。
微軟Azure
以雲端業者而言,微軟雲端與人工智慧事業群執行副總裁Scott Guthrie透過預錄影片,發表兩款鎖定高效能運算應用的執行個體服務:HX系列、HBv4系列,都運作在400 Gb InfiniBand網路環境中。
基本上,前者固定提供1,408 GB記憶體,每顆核心最大可搭配將近60 GB記憶體(搭配24顆核心的EPYC 9004處理器),適用於晶片設計用戶,可節省電子設計自動化(EDA)運作流程的成本,縮短上市時間;後者固定搭配688 GB記憶體,記憶體頻寬為800 GB/s,FP64浮點運算效能可達到6 TFLOPS,效能為搭配第三代EPYC執行個體服務的2.5倍以上,達到自行建置高效能運算伺服器的6倍。
Scott Guthrie表示,目前HX系列與HBv4系列皆為預覽版,2023年上半正式推出時,這兩款執行個體服務將搭配代號為Genoa-X的第四代EPYC處理器款式。
甲骨文OCI
Oracle Cloud Infrastructure(OCI)執行副總裁Clay Magouyrk親自出席發表會,他表示,OCI將推出一般用途、高效能運算最佳化等類型的執行個體服務,提供具備RDMA網路、裸機等環境,可藉此善用DDR5記憶體、CXL記憶體擴充帶來的新技術,以更低成本獲得更好的效能,同時,他們也打算運用第四代EPYC處理器來發展機密運算。
而在AMD發布的新聞稿提到,OCI最新發表的執行個體服務E5,將會採用AMD第四代EPYC處理器,用於甲骨文紅牛賽車車隊研發新一代的動力傳動裝置,同時,OCI旗下的多款資料庫與資料倉儲雲端服務,例如:MySQL HeatWave、Oracle Autonomous Database、Exadata Database Service,也將使用AMD第四代EPYC處理器。
Google Cloud
Google Cloud也派出副總裁暨系統與服務基礎架構總經理Amin Vahdat,透過預錄影片談到他們與AMD的合作關係。2021年他們引進AMD第三代EPYC處理器,而設立了Tau VM系列執行個體服務,因應橫向擴展最佳化類型的通用工作負載需求,後續又推出C2D執行個體服務,擴充運算最佳化工作負載類型的服務項目,如今隨著第四代EPYC上市,未來他們也將推出採用這款處理器的執行個體服務。
HPE
而在伺服器軟硬體廠商的部分,HPE、VMware、Dell、聯想、Supermicro等公司也都在這次第四代EPYC發表會,派出執行長、副總裁等級的高層為AMD助陣。在眾多伺服器廠商中,最先於AMD發表會上亮相的是HPE總裁暨執行長Antonio Neri,他透過預錄影片祝賀,宣布新設計出6款採用Genoa的新機型,涵蓋主流伺服器ProLiant系列,以及超級電腦Cray EX、Cray XD。對照HPE網站目前公布的產品資訊來看,我們已經能夠看到這6款機型的名稱與規格,其中4款是ProLiant Gen11系列伺服器,機型為DL325、DL345、DL365、DL385;
而在超級電腦的產品當中,則是Cray EX2500和Cray XD2000。根據該公司發布的新聞稿指出,在2023年第一季,搭配此款處理器的Cray XD2000開放訂購,此時登場的另一款產品Cray XD6500,也將搭配此款處理器;到了第二季,搭配AMD第四代EPYC處理器的Cray EX2500,預計開始廣泛提供。
Dell EMC/Dell Technologies
另一家伺服器大廠戴爾科技集團,派出全球基礎架構解決方案事業群核心業務營運總裁暨企業營運長Arthur Lewis親臨AMD發表會現場,他揭露該公司最新推出的多款伺服器,因採用第四代EPYC處理器而獲得優異性能——相較於前代機型(R7525搭配AMD EPYC 7763),新一代機型的浮點運算效能提升幅度,達到121%(R7625搭配AMD EPYC 9654),並在能源使用效益的部分,每瓦效能獲得55%的增長,而以每小時千瓦的費率來計算電力成本,可節省25%的費用,同時,在儲存空間的配置上,新一代機型因為支援E3.S外形的硬碟,伺服器機箱能夠容納硬碟的最大數量可提升60%——以2U尺寸的機型而言,現行的伺服器產品最多可安裝24臺2.5吋硬碟或U.2外形固態硬碟,而在他們推出的新款伺服器,可安裝32臺E3.S外形的硬碟,容量增加33%;以1U機型而言,現行的伺服器產品最多可安裝10臺2.5吋硬碟,而在他們推出的新款伺服器中,可安裝16臺E3.S外形的硬碟,容量增加60%。
而在商用應用程式效能測試中,戴爾新款1U與2U伺服器在SAP-SD的效能評測標竿中,也取得新的世界紀錄。單就可承載的使用者數量而言,新一代機型比起前代機型提升了172%——以1路機型來看,搭配AMD EPYC 9654的R7615負荷75,780人,搭配AMD EPYC 7763的R7515負荷36,600人,差距1.07倍;以2路機型來看,搭配AMD EPYC 9654的R7625負荷14.8萬人,搭配AMD EPYC 7773X的R7525負荷8.6萬人,差距1.72倍)。
而在人工智慧的效能測試當中,戴爾新款機型也寫下新的紀錄——在TPCx-AI測試,R7615在SF3、SF10的項目,分別拿到408.36分、425.31分,R6625在SF30、SF100、SF300等項目,分別拿到364.59分、868.49分、972.07分(編按:TPCx-AI效能測試於2021年9月正式成立,目前廠商提交的產品測試結果仍相當有限)。
關於確保環境永續的部分,Arthur Lewis表示,隨著每代處理器的推陳出新,伺服器整併比率已從2:1提升到5:1,若要再提升能源使用效率,他提到戴爾新款伺服器均配備Smart Cooling技術,可協助用戶管理二氧化碳的排放量——企業可透過他們提供的系統管理主控臺OpenManage Enterprise,運用其中的Power Manager追蹤伺服器提供的效能與相關的輸出,進而改善碳排放量。
聯想
Think系列個人電腦與IBM推出x86伺服器至今已滿30年,聯想集團執行副總裁總裁暨基礎架構事業群總裁Kirk skaugen在AMD第四代EPYC發表會表示,聯想在伺服器領域最近發布了52款產品(編按:應指他們在9月21日推出的Infrastructure Solutions V3產品線),規模是先前的3.5倍,而現在他們將推出21款採用EPYC新處理器平臺的機型,當中包含ThinkSystem系列伺服器,以及ThinkAgile系列搭載VMware與Nutanix等兩大超融合基礎架構系統平臺的設備。
Kirk skaugen也特別展示導入該公司Neptune溫水直接冷卻技術(Direct Warm Water-Cooling)的伺服器,透過俯視圖呈現導熱管線在機箱內部的配置。
根據聯想發布的新聞稿指出,新推出的ThinkAgile系列超融合解決方案會有14款,區分為ThinkAgile VX系列,以及ThinkAgile HX系列。到底是哪些機型?若從該公司設置的產品資訊網站Lenovo Press來看,這批最新發表的ThinkSystem系列伺服器,稱為ThinkSystem V3,目前有5款機型,分別是:SR645 V3、SR665 V3、SR675 V3、SD665 V3、SD665-N V3;而在ThinkAgile VX系列與ThinkAgile HX系列的部分,則有VX645 V3系列、VX665 V3系列,以及HX645 V3系列、HX665 V3系列,合計19款(14+5),還有兩款新機型呢?。
稍早於9月21日聯想舉行的ThinkSystem的30週年發表會,其實提到了更多採用AMD新處理器的伺服器與超融合機型。以ThinkSystem而言,這裡額外列出SR635 V3、SR655 V3(加上這兩款之後,就符合所謂的21款新機型的說法);而在ThinkAgile系列中,有VX635 V3系列、VX655系列——ThinkAgile HX系列6款機型均已在Lenovo Press公布。
Supermicro
在所有派出公司高層為AMD站臺的伺服器廠商中,Supermicro是壓軸。該公司創辦人暨總裁與執行長暨董事會主席梁見後表示,關於AMD第四代EPYC處理器的搭配,他們有15條產品線已完成出貨準備,在發表會現場的簡報畫面中,也特別秀出他們可提供超過45款採用新平臺的伺服器系統。
對照Supermicro這段期間發出的新聞稿與網站公告資訊,我們看到他們順勢推出H13世代的伺服器陣容,迎接AMD第四代EPYC處理器平臺的來臨,初期將推出12款伺服器機型,因應多節點系統(高密度)、2路系統(企業)、單路系統(雲端資料中心)、GPU系統(AI、深度學習、高效能運算)的選擇需求。
為了加速推廣新一代伺服器平臺,Supermicro今年也首度成立遠端產品試用計畫,例如,10月針對英特爾即將發表的第四代Xeon Scalable平臺對應的Supermicro X13世代伺服器機型,提供先期試用計畫,名為Supermicro X13 Jumpstart,到了11月,他們也提供同樣的線上試用產品方式,名為Supermicro H13 JumpStart。Supermicro表示,申請試用的企業需簽署保密協議、並遵守計畫守則,預計開放3至6個月供企業使用,這段期間,每個用戶可透過1個VNC、SSH、IPMI等遠端連線,進行伺服器產品的測試評估。而為了避免出現大量試用負載,導致試用計畫無法負荷的情況出現,Supermicro在此也導入專門的資源節約架構機櫃來進行管制。
技嘉、泰安、華碩也發布新機型,共襄盛舉
除了登上AMD線上發表會舞臺的眾家伺服器廠商,我們也收到其他廠商發出的新聞稿,宣傳他們搭配EPYC 9004系列處理器的新款伺服器。
以技嘉而言,他們將推出22款機型,涵蓋主機板、機架式伺服器、GPU伺服器、高密度伺服器、邊緣伺服器等5個產品線。
神雲科技旗下的泰安(Tyan)在此時發表6款產品,分別是:單路伺服器主機板Tomcat CX S8056、1U單路伺服器系統Transport CX GC68A-B8056,2U單路儲存伺服器Transport SX TS70-B8056和Transport SX TS70A-B8056,可搭配多張GPU的伺服器主機板Tomcat HX S8050,以及直立式伺服器Transport HX FT65T-B8050。
華碩也趕上這波發表會,發表多款伺服器,包含2路架構的RS720A-E12(3款)、 RS700A-E12(2款),單路架構的RS520A-E12(2款)、RS500A-E12(2款),高密度/微型伺服器RS720QA-E12,以及GPU伺服器SC8000A-E12(2款)與ESC4000A-E12。
調整型號命名方式,產品線擴增為4條,將依序出場
在第四代EPYC處理器的產品名稱,也出現一些變化。AMD本次發表的伺服器處理器稱為EPYC 9004系列,所採用的命名方式,其實與前三代有些不同,他們也在發表會前對媒體的預先說明活動當中,提出說明。
回顧過去,代號為Naples的第一代EPYC,產品型號統稱EPYC 7001系列,代號為Rome的第二代EPYC,產品型號為EPYC 7002系列,代號為Milan的第三代EPYC,產品型號EPYC 7003系列,全都是一脈相承,無其他「分號」(同個世代只有一個研發代號的產品)。基於這樣的慣例,可能絕大多數人都會認為最新發表的第四代EPYC,應該會稱為EPYC 7004系列,
然而,等到11月11日正式發表時,大家才知道、確定這批處理器的名字是EPYC 9004系列。
事實上,關於AMD改變EPYC新處理器的命名方式,我們在11月1日HPE發表ProLiant Gen11系列伺服器時,就察覺到AMD可能會調整處理器名稱,因為這家廠商在當天釋出的26秒YouTube產品簡介短片中,就閃過一張有著AMD EPYC 9004 Series Processor這些字的畫面。
不過,這個改名顯然在一些廠商的產品或服務資訊當中,產生誤植的狀況。例如,HPE Cray XD2000的QuickSpecs第一版文件中,在處理器規格的敘述上,竟同時出現EPYC 9004與7004;微軟Azure在一篇介紹HBv4與HX執行個體服務的部落格文章中,把處理器標示為「AMD EPYC™ 7004-series (standard Genoa during Preview)」與「AMD EPYC™ 7004-series (Preview)」。
然而,或許這不是標示錯誤,而是未來真的會有AMD EPYC 7004系列處理器!若按照HPE Cray XD2000的QuickSpecs文件所示,AMD EPYC 7004系列可提供16顆到128顆核心,此部分規格是有可能在其他第四代EPYC處理器產品當中提供。
對照去年11月AMD發表Milan-X處理器與Instinct MI200繪圖處理器提到的產品上市規畫與特色簡介,以及今年6月財務分析師大會所揭露的資訊,他們的確會推出代號為Bergamo的新一代EPYC處理器,當中將會提供128顆Zen 4c架構核心的處理器,屆時可透過具備更大量的CPU核心,因應雲端原生環境的市場應用需求(大型資料中心、IT服務供應商),
而基於如此高密度的運算配置,也能與近年來以Arm架構超多核心走紅的處理器產品一較高下,例如, Ampere Computing公司的Altra系列與Altra Max系列處理器(最多可提供128顆核心),以及Nvidia發展的Grace(最多可提供144顆核心)。
熱門新聞
2024-11-25
2024-11-25
2024-11-15
2024-11-15
2024-11-28