IBM開源機器學習應用程式框架CodeFlare，大幅簡化混合雲AI部署工作

IBM開源能夠大幅提升機器學習模型訓練效率的機器學習應用程式框架CodeFlare，可以簡化工作管線配置工作，讓用戶將心力放在應用本身，官方提到，當用戶使用該框架來分析和最佳化1萬個用於訓練機器學習模型的工作管線時，每一個工作管線的執行時間，將會從4小時縮短到15分鐘。

資料分析和機器學習技術，被廣泛地用於各個產業，隨著處理的工作越來越複雜，用到的系統和資料集也相對龐大，這使得研究人員需要花費更多時間，來配置這些工作流程，而非把精力花在資料科學應用上。

IBM開源了CodeFlare框架，來簡化將大量資料和人工智慧工作流程，擴展到混合雲上的工作。CodeFlare建立在Ray之上，Ray是用於機器學習應用程式的新興開源分散式運算框架，IBM擴展了Ray的功能，新添加一些元素和功能成為CodeFlare。

官方提到，要創建機器學習模型，開發人員必須要先訓練和最佳化模型，而這個過程包括了資料清理、特徵擷取和模型最佳化，CodeFlare利用Python介面的工作管線，簡化整合、平行化和共享資料，以簡化這個過程。新框架目標是要一統多平臺的工作管線流程，讓資料科學家不需要學習新的工作流程語言。

用戶已經可以在IBM無伺服器平臺IBM Cloud Code Engine和Red Hat OpenShift上，執行CodeFlare工作管線，並供用戶在任意平臺部署工作流程，拓展無伺服器服務的好處。IBM解釋，透過事件觸發轉接器，CodeFlare可從任何來源載入和分割資料，也能與其他雲端原生生態系整合，取用物件儲存、資料湖和分散式檔案系統等服務。

CodeFlare的優點在於，開發人員不需要一直重複相同的工作，也不需要理解工作管線的配置，可以使用豐富的工具和API，一致地進行操作，將更多精力放在研究上，而不必費心於配置和部署複雜工作。該框架可以節省部署到混合雲工作管線的時間和精力，IBM舉例，CodeFlare最佳化1萬個用於訓練機器學習模型的工作管線，可將執行每個工作管線的時間，從原本的4小時，縮減到15分鐘。

IBM將CodeFlare用於自家人工智慧研究上，並承諾會繼續發展CodeFlare，以支援更加複雜的工作管線，計畫強化容錯性和一致性，並改進外部來源的整合和資料管理，同時增加工作管線的視覺化功能。

熱門新聞