開源一年多,經過眾多企業的貢獻,LFAI與資料基金會旗下的開源特徵商店Feathr專案終於達到1.0版本,最新的正式版本有幾項新功能,包括線上轉換、快速沙盒環境等,目標是要加速企業級機器學習專案的開發和部署。

Feathr為企業級特徵商店,由LinkedIn在2017年開發,並2022年的時候和微軟共同開源,Feathr主要的功能是供開發者利用Python形式的的API,定義原始資料的特徵,並在模型訓練和推理工作流程中,按名稱註冊和取用特徵,透過Feathr企業能夠方便地在不同的團隊間共享特徵。

由於準備和管理特徵,是開發大規模機器學習應用程式,極度耗費時間的工作之一,而Feathr提供一個抽象層,供開發者方便地按名稱計算和存取特徵,使得特徵生產者和消費者都可以透過Feathr交易特徵,生產者定義並註冊特徵,讓消費者存取和匯入特徵至機器學習工作流程中。

Feathr正式版中提供了特徵即時轉換支援,官方提到,在許多機器學習場景中,訓練和推理都需要產生特徵,但是Feathr卻有著資料來源無法來自於線上服務的限制。

由於特徵轉換只能發生在特徵資料發布到線上商店之前,因此當要求轉換速度接近即時,便需要建立一個機制,供用戶能夠在模型進行推理之前,動態地對推理資料進行轉換,而Feathr新的特定領域語言(Domain Specific Language,DSL)線上轉換功能,使用自定義轉換引擎解決這樣的問題,該引擎能夠以接近即時的速度,處理特徵轉換請求並且提供回應。

另外,Feathr還加入功能齊全的沙盒環境,能夠快速啟動Feathr環境,供使用者快速對Feathr各種功能進行原型設計,讓沒有基礎設施背景知識的資料科學家,也能夠快速上手Feathr,實驗特徵定義和想法。該沙盒帶有Jupyter筆記本,供使用者能夠簡單地操作Feathr平臺。

熱門新聞

Advertisement