圖片來源: 

英特爾

開發代號為Nehalem-EP的新一代Intel處理器,於三月底推出伺服器專用的 Xeon 5500系列(Nehalem EP)。與前代處理器相較,新架構特別強化了記憶體存取的效能,並增加了Turbo Boost技術,可於短時間內增加處理器頻率,以強化伺服器處理效率。在整體測試上,新平臺總體效能勝出許多,且記憶體與快取傳輸效能也大幅提升。

除了追求高效能外,降低耗電量也是目前這個運算核心發展的目標之一,而Xeon 5500則是採用整合式電源閘極(Integrated Power Gates)與自動化低電源狀態(Automated Low-Power States)兩種自動化技術,分別降低處理器與記憶體閒置時的耗電量。我們測試結果,也可觀察到新平臺伺服器也比前代機種省電,在我們測試中,用電甚至可降低25瓦之多。

 

 小辭典─Nehalem伺服器級處理器 

開發代號為Nehalem-EP的Intel Xeon 5500系列處理器,改變前代記憶體控制器配置方式,藉由QPI增加記憶體存取效能;並持續強化虛擬化指令運算,以提升虛擬平臺資料交換的速度。另外,新處理器在省電技術上,亦推出兩種技術降低閒置核心用電量。

 

性能─檢視新一代處理器所展現的效能
                實測核心運算與記憶體存取
                新處理器的平均記憶體存取速度,較舊平台快上1倍多

在我們實際測試的結果中,Xeon E5504在整體運算、核心運算與記憶體存取上的效能上,均優於前一代的E5420,特別是在記憶體傳輸效能上的提升幅度非常明顯。而這顆新一代處理器在效能強化所採用的技術也相當值得你進一步了解,例如處理器改以QuickPath來執行記憶體控制的架構,也加入暫時增加核心運算效能的Turbo Boost與P4時代就出現的Hyper Threading。

效能評測的部分,我們的做法是透過一些軟體來驗證Xeon 5500系列處理器效能,項目包括:處理器整體運算、核心運算與記憶體存取上的效能。

新版處理器記憶體傳輸效能大幅提升

我們實際測試兩臺規格相仿的伺服器,其中之一採用Xeon E5504處理器,而另一款主機則使用舊的Xeon E5420處理器。並使用Hot CPU Tester Pro 4與NucleaRus Multi Core處理器測試工具軟體,實測它們的運算效能。

我們以Hot CPU Tester Pro 4軟體來實測兩個平臺,Xeon E5420得到的總分為13251分,而Xeon E5420的總分則是11223,採用新處理器伺服器的效能多了2028分。

在處理器核心運算測試中,我們採用NucleaRus Multi Core的測試工具軟體,結果是舊款的Xeon E5420,在浮點運算等項目的分數上,反而略勝Xeon E5504,這應該是由於E5420單一核心時脈為2.5GHz,高出E5504的2.0GHz所致。

記憶體存取測試上,我們一樣用NucleaRus Multi Core測試效能,我們可以觀察到新版處理器在快取與記憶體的存取速度,都有顯著的增加。以記憶體寫入為例,Xeon E5504為每秒5419Mb、E5420為2709Mb,速度差距近乎1倍;而在記憶體讀取測試中,E5504為9938Mb/s,E5240則是3896 Mb/s,兩者的速度差了約2.3倍。記憶體存取效能大幅進步,除了記憶體控制架構改變外,新處理器平臺採用的記憶體為DDR3,時脈高達1333MHz,也讓記憶體效能提升不少。

雖然新版處理器(Xeon E5504)在核心運算測試上,雖然表現沒有特別突出,不過在記憶體存取效能上大幅提升,也讓整體核心運算分數高出許多。

改善效能相關的三大技術

在Nehalem EP處理器上,Intel加入了幾項改善效能的技術,它們分別是QPI、Turbo Boost與Hyper Threading。

QPI架構使記憶體控制改由處理器負責

此款處理器最大的變革,就是改用Intel QuickPath InterConnect(QPI)技術,將處理器指派與管理交由處理器內的記憶體控制器處理,而並非先前採用的前端匯流排技術(Front-Side Bus)。這樣的作法,其實就是將記憶體控制器,由北橋晶片移到處理器上,主要是改善原本北橋晶片,無法有效發揮記憶體效能的瓶頸。

改用QPI的運算結構,搭配三通道的DDR3記憶體,可改善其傳輸效率,藉此提升整體運算效能。除了加強記憶體傳輸效率外,新的記憶體控制器也增加記憶體支援量,單一插槽的記憶體最高可到16GB,而Xeon 5500系列可支援至192GB記憶體,相較於以往64GB上限,提升整整3倍之多。

Turbo Boost可暫時提高處理器頻率

Xeon 5500系列處理器加入Intel Turbo Boost技術,能在系統需要大量運算時,在容許範圍內暫時超頻,動態增加處理器運算頻率,來處理瞬間湧至的尖峰需求。

Turbo Boost的運作方式,是在處理器面臨瞬間的大量資料時,於每個核心增加1階運算頻率,而1階的頻率為133MHz,在條件限制下,Turbo Boost最高可增加4階,也就是532MHz。

這項新技術主要參考依據為啟用核心數、電源耗用量、處理氣溫度與處理器運算量等。在上述三者允許的情況下,處理器就會短暫超頻。在Intel Xeon 5500中,當處理器僅使用其中2個核心時,每個核心最高可增加2階頻率(266MHz),若是處理器僅使用1個核心,則頻率最高可暫時增加4階。要注意到,並非Xeon 5500系列的每個處理器都支援此技術,以我們實測的Xeon E5504來說,就沒有包含此功能。

以Hyper-Threading提升指令處理效率

從Intel P4系列處理器推出以來,Intel就有超執行緒(Hyper-Threading,HT)的技術,以改善處理器的效能,在Nehalem處理器,HT又重出江湖。透過HT加速指令傳輸,減少伺服器閒置狀態,藉此提升整體運作效能。

加入HT的處理器,單一核心可執行2個軟體執行緒,四核心處理器就會有高達8條的執行緒,能加強指令傳遞至處理器運算的速度,在處理器核心執行指令的同時,另一條執行緒會接著將下個指令傳遞給處理器,藉此強化處理器運作效能。要注意到,並非所有Xeon 5500的處理器均具備,而要啟動這項技術,尚需作業系統與應用程式支援才行。省電─驗證Nehalem平臺伺服器用電量

採用Nehalem平臺的伺服器,在我們實測的結果中,平均用電量都呈現較低的數值。技術上,Xeon 5500系列主要加入了兩種針對處理器閒置時的省電方式,這部分的做法也是Intel前所未有的。

 

 處理器整體效能測試 

在Hot CPU Tester Pro 4的整體效能測試上,我們測得既有的E5420有11223 分,而新的E5504為13251分,效能較前代機種多了2028分。

 

 處理器核心運算測試 

我們用NucleaRus MultiCore 軟體來測試處理器核心效能。舊款處理器Xeon E5420 分數都略高於新的Xeon E5504。可能是舊款處理器Xeon E5420的時脈較高(2.5GHz)的關係。

 

 記憶體存取測試 

在NucleaRus Multi Core來測試處理器對記憶體存取的效能,不論是快取或動態存取記憶體,新的Xeon E5504 較前代的Xeon E5420 快許多,其中記憶體讀取測試,甚至差距1倍以上。

 

省電─驗證Nehalem平臺伺服器用電量
                實測不同平臺伺服器運作功耗
                新一代處理器在閒置時的節電效果最明顯,耗電量較舊款節省近25瓦

Xeon 5500用電量均低於前代處理器

實際運作上,可否看出省電效果呢?我們實測兩臺伺服器,個別安裝Intel Xeon 5500系列與Xeon 5400系列處理器,並觀察他們在不同狀態時的用電量。在主要規格相近的捷洲兩代伺服器產品間,我們分別安裝單一與兩顆實體處理器,並針對這兩種狀態觀察它在處理器滿載、閒置與作業系統載入時的用電量。

測試結果中,不論是在閒置狀態或作業系統載入時,Xeon E5504的耗電量大多低於Xeon E5420,特別是我們僅安裝單一處理器時,伺服器耗電量差距特別明顯。

在耗電量測試中,我們觀察到伺服器內僅安裝單一處理器時,之間的耗電量差異較同時安裝2顆明顯,例如當兩臺伺服器僅使用1顆處理器時,實測彼此在閒置的用電量,差距多達25瓦,而安裝2個處理器則僅差3瓦,較果較不顯著。

處理器在滿載時,則出現單處理器的Xeon E5504用電量大於Xeon E5420,且差距多達32瓦,而在雙處理器時,安裝Xeon E5504的主機耗電量為185瓦,相較於Xeon E5420的200瓦,用電量足足少了15瓦。

關鍵技術:關閉閒置處理器核心與記憶體用電量

在Xeon 5500新的省電機制上,增加了整合式電源閘極,與自動化低電源狀態兩種技術。其中整合式電源閘極的功能,是將處理器中閒置的核心關閉,以降低其耗電量。處理器核心與記憶體、快取、I/O等控制器是分離供電的,運作時,會判別目前核心使用狀況,在不影響運算處理的前提下,自動降低閒置的核心的供電量,藉此讓該核心暫停運作,當系統需要該核心的運作效能時,會於2微秒內重新啟動它,迅速恢復處理器原有的運算效能,以免閒置核心在重新啟動上花費太多時間,反而對處理器的運算效能產生負面影響。

而所謂的自動化低電源狀態,主要針對記憶體與PCI-E來節電。記憶體控制器和I/O控制器都具有電源管理功能,和前者類似,此技術會降低閒置記憶體區塊的運作時脈,讓記憶體僅使用保存內容的用電量,當系統需要存取或異動這些區塊時,再恢復運作時脈。

除了使用上述兩種自動化省電技術,能於核心元件閒置時,降低用電量之外,如果想要手動調整單一伺服器內供給處理器的用電量,Intel亦有1套Node Manager工具,讓處理器依照限制電量,自動降低運作時脈,將其耗能限縮在設定區間內。

 

 Xeon 5400與Xeon 5500測試平臺規格 

我們測試採用2 臺伺服器,分別為捷洲i1-272AH4 與捷洲i1-272AH3 ,這兩臺伺服器為同型號不同款機種, 其中i 1-272AH4 使用Xeon 5500 系列處理器,而i1-272AH3 則是前代機種,它使用的處理器為Xeon 5400系列。新平臺的處理器為Xeon E5504,核心時脈為2.0GHz,而前一代則使用Xeon E5420 ,它的時脈為2.5GHz,較新處理器高些。
兩臺伺服器的記憶體數量皆為12GB,彼此間最大的差異,在於新平臺使用DDR3 記憶體,而前代主機是採用DDR2的。而磁碟的部份,兩者均使用3.5吋1萬5 千轉SAS 硬碟,其中舊款伺服器由於主機板並不支援SAS硬碟,因此有額外安裝一張SAS磁碟陣列卡。
在測試伺服器上安裝的作業系統,均使用64位元Window Server 2008企業版。
效能測試上,我們採用Hot CPU TesterPro 4與NucleaRus Multi Core兩套處理器工具軟體,實測兩代處理器的運作效能。用電量測試上,我們於測試時處理器滿載、作業系統載入,以及處理器閒置等三階段,觀察伺服器上僅安裝1 個處理器,與安裝2 個處理器的最高用電量。

 

 耗電量測試 

於同型號的兩代伺服器上安裝新處理器,採用Xeon E5504的機種的平均耗電量,在三種條件下均低於前一代處理器的機種。

 

 整合式電源閘極運作示意圖 

Xeon 將運算核心與其他控制器分離供電,並使用整合式電源閘極技術,能關閉閒置核心的用電量。

 

 Intel Xeon 5500處理器型號一覽表 

 

【相關報導請參考「Nehalem出擊,引爆伺服器世代交替」】

熱門新聞

Advertisement