Google釋出了可簡化機器學習開發者,創建機器學習模型透明度資訊模型卡(Model Cards)任務的工具集,Model Card已經被Google用於跨平臺人工智慧工作管線框架MediaPipe中,現在Google釋出完整的Model Card工具集,助社群成員方便創建模型卡。

機器學習技術已經被大量地用於醫療保健和金融等各個領域,當人們越來越仰賴機器學習模型做出決定,則模型的透明度就越來越重要,讓用戶得以了解模型計算出結果的依據,Google提到,下游用戶需要的資訊各有不同,這些資訊可用來確認模型是否適用於特定案例。

模型卡是Google開發來觀察模型透明度的工具,模型卡提供模型來源、使用方法和道德規範相關評估資訊的結構性框架,並且還會提供模型使用限制建議。Google將模型卡用在MediaPipe中,MediaPipe提供了許多用來解決常見電腦視覺任務的模型,而在GitHub儲存庫除了模型,同時也提供了模型卡,讓模型使用者能夠更了解模型。

不過,創建這樣的模型卡需要大量的時間與人力資源,通常需要對資料和模型效能,進行詳細的評估和分析,在許多情況下,還需要另外評估模型在不同資料子集上的效能,並注意模型表現不佳的部分,而且模型卡的創建者,可能還希望能夠提供模型的預期用途和侷限,以及用戶可能需要考量的道德因素等各種資訊。

而為了簡化機器學習開發者創建模型卡的複雜度,Google釋出了模型卡工具集,這是一系列可以支援開發者,將資訊編譯到模型卡的工具,為不同受眾創建有用的介面,為了說明模型卡工具集使用方法,Google還發布了Colab教程,幫助使用者上手。

Google在模型卡工具集提供了JSON架構,該架構定義了要包括在模型卡中的欄位,並且提供了ModelCard資料API,可用來表示JSON架構的實例,並將其視覺化成模型卡,用戶最終可以決定模型卡要顯示的指標和圖形。

模型卡除了顯示關鍵指標和圖形之外,還能補充其他資訊,像是模型預期用途與限制等,Google提到,在模型卡詳細說明模型的限制,像是表現不佳的資料段等,這些資訊可以幫助開發人員,將模型應用在適合的使用案例上。

目前Google提供了一個UI模板來視覺化模型卡,而用戶也能利用HTML創建不同的模板。現在使用TensorFlow Extended(TFX)的用戶,能夠使用模型卡工具集,而不使用TFX提供機器學習模型服務的用戶,仍可以利用JSON架構,以及HTML模板視覺化方法。

熱門新聞

Advertisement