圖片來源: 

郭又華攝

英特爾今天於Computex 2024正式公布新一代筆電處理器Lunar Lake,是Core Ultra系列第二代產品。鎖定AI PC需求,此處理器TOPS(每秒幾兆次操作,Tera Operations Per Second)高達前一代3.5倍,且能源使用效率上,耗電量較前代低了40%。

早在去年推出第一代Core Ultra產品Meteor Lake時,英特爾執行長Pat Gelsinger便提出了AI PC時代這一說法──未來所有筆電中都會整合NPU等硬體,以高效執行AI相關運算任務。然而,Meteor Lake的NPU算力只有11.5 TOPS,當時市場上卻已經有搭載了31.6 TOPS算力NPU的M2 Ultra處理器等競品,前者競爭力顯得不足。

來到今年,上個月底微軟於自家開發者大會公布了Copilot+ PC,更加凸顯出AI PC趨勢不可擋。首批Copilot+ PC與高通合作,使用高通Snapdragon系列處理器。不過,Snapdragon的PC產品在市場上份量相對小,下一波預計搭載英特爾和AMD處理器的Copilot+ PC,才會觸及更多主流PC市場。

Lunar Lake正是預計裝入這款AI PC的處理器,NPU算力有48 TOPS。AMD昨天發表的Ryzen AI 300處理器則搭載了有50 TOPS算力的NPU。兩者算力相近,且相較首批Copilot+ PC搭載的40 TOPS高通NPU都高了一截。

不只NPU算力較前代處理器Meteor Lake大幅提升,Lunar Lake搭載的CPU、GPU、NPU,都翻新了設計架構,來提升算力和能源使用效率,支援多元AI運算任務。這一代處理器算力共有120 TOPS,包含CPU的5 TOPS、GPU的67 TOPS,以及NPU的48 TOPS算力。

NPU採英特爾第四代NPU架構,算力達48 TOPS

這一代Lunar Lake的NPU採取Intel NPU 4架構,相較前一代NPU算力提升了36.5 TOPS,來到48 TOPS。

這顆NPU搭載了6個神經計算引擎NCE(Neural Compute Engine),相較前代增加了4個,等於每次運算週期可以處理12,000次乘積累加運算(MACs)。NPU 4還搭載了12個處理向量運算用的VLIW DSP,且從前一代128bit頻寬提升到512bit頻寬。另外,直接記憶體訪問(DMA)頻寬也提升了1倍。這些都是大幅提升算力的關鍵硬體升級。

能源使用效率方面,由於大部分NPU耗能都用於矩陣運算及數據傳輸兩項工作,英特爾在NCE中的推論管線(Inference Pipeline)設計中,優化了運算效率及任務排程功能,來降低耗能。

如圖所示,NPU 4的效能/耗能比,相較於NPU 3高出2倍,且最高效能可達NPU 3的4倍。圖片來源-英特爾

圖為Meteor Lake與Lunar Lake跑Stable Diffusion 圖片生成任務時的表現比較。Lunar Lake搭載了更強大的NPU 4,能負責原本由CPU和GPU處理的部分任務,因而提升效能/耗能比。圖片來源-英特爾

GPU效能提升1.5倍,算力達67 TOPS

與前一代一樣,Lunar Lake的圖形運算區塊由GPU及其他專責圖形運算區塊組成。相較於前一代分為4個區塊,這一代則是拆成GPU、顯示區塊及多媒體處理區塊共3區。英特爾在顯示及多媒體運算區塊中,從軟硬體上分別針對各自專責工作進行效率及耗能優化,例如選擇性畫面更新及記憶體配置優化等。

Lunar Lake的GPU採取了新一代Xe2 GPU架構,由8個Xe2核心組成。每個核心採用原生SIMD16(單指令多重資料)引擎,內含8個512-bit Xe Vector Engines (XVE)向量引擎,以及8個2048-bit Xe Matrix eXtensions(XMX)矩陣引擎。XVE引擎支援SIMD和SIMD 32向量運算,以及INT8、FP16、BF16的矩陣運算,和各式三角、指數等超越函數運算。XMX引擎規格則是每周期能執行2048次FP16運算,或4096次INT8運算。

整體來說,Xe2效能相較前一代提升了1.5倍,特定任務甚至提升了12.5倍。總共67 TOPS的算力及對向量、矩陣運算的支援度,也使Xe2 GPU能負責執行負荷較重的AI運算任務。

Xe2新硬體架構搭配專屬的指令集,使其相較前一代GPU在許多表現上都相較第一代有大幅提升。圖片來源-英特爾

4顆E-Core及4顆P-Core的CPU架構,大幅升級的E-Core是高能源效率關鍵

相較於Meteor Lake有低耗能E-Core、一般E-Core及P-Core三種效能的CPU,Lunar Lake取消了低耗能E-Core的設計,只搭載了4顆高能源效率E-Core及4顆高運算效能P-Core。其中,E-Core規格提升幅度尤其引人注目。

新一代E-Core採Skymont架構,IPC(每時脈週期指令數量) 相較前一代有大幅提升,整數運算任務增加38%、浮點運算任務更大增68%。同樣效能下,這一代E-Core耗能只有前一代低耗能E-core的1/3。英特爾更宣稱新一代E-Core在向量運算及AI相關運算的效能較前一代提升1倍。

E-Core效能及能源使用效率大幅提升,意味著可以將更多日常運算任務留給低耗能的E-core,只有真正要求高效能的任務才會動用到P-Core。

以執行Microsoft Teams為例,Meteor Lake不時會需要將運算任務交由較耗能的P-Core來執行,甚至來回在不同CPU間調度。受益於E-Core規格大升級,Lunar Lake則能一直使用E-Core來執行此任務。圖片來源-英特爾

高效能CPU P-core也升級為新一代Lion Cove架構,IPC相較前一代提升了14%。新架構下,記憶體、運算單位等多項硬體規格提升,且調控運轉時脈頻率的顆粒度更精細,能在同樣耗能下擠出更多效能,減少硬體閒置情況。

不只如此,新P-Core還能根據當下執行的運算任務及溫度來即時調控運轉效能,而非根據預先設死的標準來調控。相較於後者做法,前者可以使CPU在不過熱的情況下,用更高時脈頻率運轉。

除了運算單位升級,Lunar Lake其他升級包括:支援Wi-Fi 7與藍牙5.4、搭載2顆LPDDR5x DRAM記憶體,運作速率8.5 GT/s,最多可至32GB,以及更新了能源管理及執行緒分配機制來更進一步提升能源使用效率。英特爾還推出了Lunar Lake開發者套件,輔助開發者針對新處理器開發AI應用。

Lunar Lake預計第三季上市,至於搭載Lunar Lake的Copilot+ PC何時會推出,英特爾沒有進一步揭露更多細節。

熱門新聞

Advertisement