AWS釋出只要需要開發人員撰寫三行程式碼,便能產出高效能神經網路模型的開源函式庫AutoGluon,供開發人員應用在處理圖像、文字和表格資料集的機器學習應用程式。 AWS應用科學家Jonas Mueller表示,AutoGluon能讓機器學習的應用更加普及,賦予所有開發人員運用深度學習的能力。

要部署深度學習模型並達到最佳的效能,開發人員需要具有廣泛的專業知識,AWS提到,儘管目前深度學習的應用,仍局限於數量有限的專家,但過去十年簡化深度學習,努力讓專業人員更容易使用深度學習的工作,已經大有斬獲。

AWS舉例,像是過去開發人員需要投入大量的時間,以計算深度學習模型所需要的梯度(Gradient),梯度是向量,用來表示最有效參數的更新,以最大程度降低訓練資料中範例的錯誤,而後來則出現像是Theano等軟體函式庫,可以自動計算高度複雜神經網路的梯度,並且提供樣板程式碼,讓開發人員可以更簡單地利用日益複雜的神經網路架構。

另外,還有像是Keras函式庫,則是深度學習函式庫TensorFlow的抽象,讓開發人員僅需撰寫幾行程式碼,就能指定像是輸入的數量和層數等參數,讓開發者少寫許多重複的程式碼。AWS提到,雖然有了這些改進,但是應用深度學習技術仍有許多麻煩,像是超參數調整、資料預處理、神經架構搜尋以及轉移學習相關的決定等問題。

為此,AWS開發了AutoGluon,AWS提到,開發人員不再需要於設計深度學習模型時,手動嘗試數百種選擇,只要簡單地指定模型訓練時程,AutoGluon就可以利用被分配的計算資源,在時間內運算出最佳的模型。

以往開發人員為了要找出模型的超參數,需要作出許多選擇,諸如神經網路的層數,以及決定網路的結構,同時也要選擇神經網路訓練的方法。Jonas Mueller提到,由於深度學習的不透明性,專家在不少時候做出的選擇,都是仰賴直覺,而非依據可預期的結果,做出合理的判斷,AutoGluon解決了這個問題,因為所有選擇都會在預設範圍中自動調整,而預設範圍可在特定任務和模型表現良好。

AutoGluon網站提供了許多現成的範例,可讓開發者學習將AutoGluon用於表格、文字和圖像資料的方法,對進階的開發人員,AutoGluon網站還有教導使用AutoGluon API的說明,在客製化應用程式中自動改進預測效能的方法。

熱門新聞

Advertisement