資料分析公司Databricks發布最新機器學習平臺MLflow 1.12,這個版本除了提供可解釋性機器學習功能之外,也強化了深度學習函式庫PyTorch的支援。由Apache Spark技術團隊所創立的Databricks,在2018年的時候開源了MLflow,透過提供各種好用的功能,簡化機器學習開發,並且支援可重複使用的標準格式,讓用戶的機器學習應用不被工具和環境綁住。

PyTorch工程團隊和Databricks的MLflow團隊,共同在PyTorch開發人員日,發表最新的合作成果,現在MLflow與PyTorch整合,提供PyTorch模型自動日誌記錄、支援TorchScript模型,以及可將PyTorch模型部署到TorchServe等3個功能。

MLflow 1.12所提供的統一自動日誌記錄功能,可以自動記錄來自PyTorch Lightning模型的參數以及指標,在新加入的mlflow.autolog()方法,只要用戶執行單一呼叫,該方法就會自動記錄所有相關的模型實體,包括參數、指標和構件等,讓用戶掌握模型的運作。

MLflow現在也可以將PyTorch模型轉換為TorchScript,TorchScript是一種由PyTorch程式碼創建的可序列化和可最佳化的模型,任何MLflow生成的PyTorch模型,都可以被轉換成為TorchScript,能夠儲存並部署到其他非Python相依環境。TorchServe MLflow擴充套件,則可讓用戶將任何MLflow生成的PyTorch模型,部署到模型伺服器TorchServe中,透過TorchServe執行模型提供服務。

另外,最新的MLflow還進一步提供模型可解釋性,Databricks官方提到,越來越多機器學習模型,在業務應用程式中,執行提示與決定性預測,因此機器學習工程師開始必須要解釋,模型做出特定決策的原因,MLflow 1.12提供SHAP API,以提供機器學習模型輸出的解釋。

熱門新聞

Advertisement