AMD釋出最新的ROCm 6.3版本開源軟體,新增頂尖工具以簡化開發,同時提升人工智慧(AI)和高效能運算(HPC)工作負載的效能和可擴展性。
ROCm 6.3的關鍵亮點包括:
-
SGLang-專為優化在AMD Instinct GPU上執行的大型語言模型(LLM)和視覺語言模型(VLM)等頂尖生成模型的推論所建構,可提升LLM推論的吞吐量高達6倍。
-
進階的Transformer最佳化-FlashAttention-2為ROCm 6.3進行最佳化,可將Transformer模型訓練和推論加速高達3倍,縮短企業級AI的上市時間。
-
AMD Fortran編譯器-簡化傳統HPC應用的GPU加速,提供直接卸載、反向相容性,並且能輕鬆整合,無需大量更改編碼。
-
rocFFT中的全新多節點FFT-多節點FFT支援在更大的資料集上進行高效能FFT運算,改善油氣和科學研究等領域的效率與決策時間。
-
增強的電腦視覺庫-AV1和rocJPEG等增強視覺庫使開發者能夠為各種工作負載建構先進的AI解決方案,例如影片分析和資料集增強,助力媒體娛樂至自主系統等產業。
-
透過秉持開源精神並不斷發展以滿足開發者需求,AMD ROCm 6.3持續幫助企業加速創新,提升擴展能力,並在競爭激烈的產業中保持領先地位。
熱門新聞
2024-12-03
2024-12-02
2024-11-29
2024-12-02
2024-11-30
Advertisement