GCP用戶可以開始嘗試使用資料探索與元資料管理服務Cloud Data Catalog,Google在今年Cloud Next大會發布了這項新服務,現在推出公開測試版。Cloud Data Catalog使用Gmail和Google雲端硬碟相同的搜尋技術,讓用戶可以使用不同的過濾器,以表格名稱、欄位名稱或是原資料等標籤,快速的搜尋資料。

Data Catalog可以用來搜尋雲端資料倉儲服務BigQuery中的表格,或是搜尋訊息與事件擷取服務Cloud Pub/Sub中的主題,而且還與IAM整合,用戶能從存取控制中管理Data Catalog搜尋的權限。Google表示,Data Catalog提供了一個所有資料集的統一檢視圖,讓組織能夠一次的查看所有資料資產,該服務會自動以結構化格式,透過標籤、自定義的API以及UI,擷取BigQuery以及Cloud Pub/Sub的業務元資料。

用戶可以使用標籤樣板定義業務元資料,並將它們應用在不同的資料集中,Cloud Data Catalog擴充傳統業務術語概念,增加了電腦科學中的雙精度、布林值以及列舉類型,以儲存元資料和字串。Google提到,Cloud Data Catalog可以讓用戶以元資料標記資料資產,方便進行管理與搜尋,像是現在業務類別能以列舉類型,從預設的類別列表中分配給資料資產,以便在擷取元資料的時候,能獲得一致的類別。

要使用Cloud Data Catalog服務,用戶可以在GCP控制臺左側導覽面板找到Data Catalog選項,啟用了之後,用戶的所有BigQuery表格都會自動編列索引,並且成為可搜尋的狀態,管理員可以定義業務標籤樣板,並將其應用到所有資料集中。

熱門新聞

Advertisement