Google更新雲端資料集解決方案,讓企業用戶能以更加統一的方式,同時取用公共和商業資料。另外,Google還開源公共資料集參照基礎架構,使得公開資料來源更透明,用戶也可以分叉到自己的Google帳戶,以便上線私有資料集並將其用於商業目的。

Google這項針對企業的雲端資料集解決方案,是建立在現有的公共資料集計畫之上,只是現在將應用的範圍,從公共資料擴展到商業資料集、綜合資料集和第一方Google資料資產上,來增加分析和人工智慧服務的價值。

在2016年的時候,Google公共資料集計畫和美國國家海洋暨大氣總署(NOAA)、美國國家研究院等許多資料供應商合作,將經過格式最佳化的資料放在BigQuery和雲端儲存上,作為精選公共資料資產目錄,Google提到,許多資料可供各行業進行各種分析,像是NOAA的嚴重風暴事件的公共資料集,在結合零售商自己的庫存資料後,就可以分析惡劣天氣對銷售與庫存的影響。

而透過將商業、合成以及第一方的資料加到計畫中,用於資料分析和人工智慧,可進一步強化分析的能力,另外,用戶也可以透過Earth Engine和Kaggle的目錄,來探索並且取用這些資料集。

除了豐富雲端的資料集之外,Google還發布用於資料匯入的開源參照基礎架構,這樣即便用戶不將企業私人資料放到Google雲端上,也能使用這些資料進行綜合分析。Google提到,可以把新的參照基礎架構想成網頁框架,網頁框架可以用來處理建構網頁應用程式所要進行的繁瑣工作,而參照基礎架構,則可以用來減少開發和維護資料工作管線的額外工作。

參照基礎架構是一個資料集上線的工作管線基礎架構,使用YAML配置檔案來簡化控制。Google宣布將公共資料集的參照基礎架構開源,讓使用者不只可以清楚資料來源,並且也讓有意想要公開資料集的組織,能夠研究利用該架構,將資料放上Google雲端,而企業也可以藉由分叉基礎架構專案,並在自有的Google雲端帳戶上線資料集進行商業使用。


熱門新聞

Advertisement