微軟推出一個稱為Fabric的端到端統一分析平臺,其整合了各種資料和分析工具,將Azure Data Factory、Azure Synapse Analytics和Power BI技術都匯集到同一個平臺中,並且以多雲資料湖OneLake儲存分析服務需要用到的所有資料。

微軟強調Fabric是一個完整的分析平臺,所有資料分析專案需要用到的工具,全部被整合到同一個產品。Fabric針對團隊中不同的角色,提供特定的功能體驗,因此資料工程師、資料科學家甚至是業務,都能夠以熟悉的工作方式使用Fabric。Fabric的核心工作負載包括Data Factory、Synapse Data Engineering、Synapse Data Warehousing、Synapse Real-Time Analytics和Power BI等。

這些核心工作負載需要用到的資料,皆來自多雲資料湖OneLake,微軟解釋,這樣的概念就與Microsoft 365應用程式都會連接到OneDrive相同,資料會在同一處被組織並自動索引,供後續探索、共享、治理、法遵目的使用。

每個Fabric租戶皆使用OneLake,以避免因不同使用者配置產生資料孤島,OneLake向所有用戶提供統一的儲存系統,並且統一應用策略和安全配置,進而使資料能夠更簡單地探索和共享。

在API層,OneLake建立在Azure Data Lake Storage Gen2(ADLSg2)之上,因此可接上ADLSg2既有的應用程式、工具和開發人員生態系。OneLake有一個稱為Shortcuts的重要功能,能夠虛擬化ADLSg2、Amazon S3和Google雲端儲存的資料湖,供開發人員跨雲組合和分析資料,並讓用戶和應用程式更簡單地共用資料。

OneLake採用以Parquet為基礎的開源檔案格式Delta,而這也是Fabric所有工作負載預設使用的格式,因此一旦資料被載入到OneLake中,所有工作負載就可直接操作該資料,不需要執行額外的擷取工作。

Fabric還對OneLake應用通用安全模型,所有引擎在處理查詢和執行任務時,都將統一受該模型控制。Fabric大量整合Azure OpenAI服務Copilot,使用戶可以透過自然語言,創建資料流和資料工作管線,甚至生成程式碼和建置機器模型等工作。

熱門新聞

Advertisement