資料倉儲通常用作資料採礦、商業智慧,能夠包山包海,也可以處理單一主題

近年來企業e化已經不限於關心流程是否順暢,交易記錄完整儲存等單一系統的議題,往往更在意異質資訊系統間的整合,如何有效彙整與呈現資料,對企業營運效率的影響越來越具體。資料倉儲(Data Warehouse)的概念,即是引用倉庫儲存的概念,不僅儲存實體的原物料與成品,在資訊系統上也能夠將抽象的檔案資料統整,而且轉換成實體的資料倉儲。資料庫、資料倉儲、資料倉儲系統的區別

資料倉儲是儲存大量資料的資料庫,與資料庫卻不盡然相同。資料庫儲存的資料與營運(Operation)相關,資料倉儲會在資料累積一段時間後,再整理、移轉至另一個資料系統中作資料分析。資料倉儲通常指的是儲存整合後資料的資料庫,資料倉儲系統則泛指整個決策輔助系統,包括系統的軟硬體、資料與報表。

「資料倉儲」這個名詞在西元1990年由Bill Inmon所創造出來的,因此被喻為資料倉儲之父,在「What is a Data Warehouse」書中,他認為資料倉儲的資料收集,有4種特性:主題導向的(subject-oriented)、經過整合的(integrated)、依循時間變動的(time-variant)、不會流失的(non-volatile),根據這些特性,使資料倉儲能夠將資料提供給決策管理系統進行處理。另一位資料倉儲的代表性人物Ralph Kimball,在「The Data Warehouse Toolkit」一書中認為,資料倉儲是一種經過結構化,可以查詢和分析的交易資料副本。

「主題導向」是說資料倉儲可以集中與特定主題相關的資訊,而不只是公司目前的營運資訊;「經過整合」是指存放在資料倉儲的資料是從不同的來源合併,並且維持一貫有條理;「依循時間變動」說明資料倉儲以特定的時間點辨識儲存的資料;「不會流失」則是表示資料倉儲中的資料只會持續增加,不會被移除,這能夠使管理階層得到企業商務持續性的觀察。資料倉儲的類型

資料倉儲可分成企業資料倉儲(EDW)、操作型資料商店(Operational Data Store)和資料市集(Data Mart)。有的人又認為資料倉儲除了企業資料倉儲和資料市集外,還可以加上虛擬資料倉儲(Virtual Data Warehouse)、混合式倉儲(Hybrid Data Warehouse)。

企業資料倉儲。企業資料倉儲包含整個企業的資訊,由數個主題組成,例如客戶、產品、業務等面向,能夠用在決策支援,有即時資訊,也有彙總過的資訊。

操作型資料商店。「操作」,是相對於資料倉儲的資訊性而言,ODS提供明細資料,特別是經過統整的近期資料,能夠供應即時報表的需求,作業型資料商店只能分析很近期內的資料,無法分析較長期的歷史資料。Bill Inmon在1995年發表的「The Operational Data Store」他認為ODS的資料集合是主題導向的、經過整合的,不過與資料倉儲不同之處在於,ODS的資料會流失,以當下的數值為主,不含歷史與累計資料,而且ODS資料能夠做到即時的整合性蒐集。ODS根據資料同步更新的頻率,將資料的轉送與儲存時程也有等級之分。

資料市集。與資料倉儲的定義大致相同,資料倉儲涵蓋整個公司的資料與人員,而資料市集只包含特定範圍的資料,而且使用者會鎖定某一個工作群組的人員。一組資料市集可以組成一個企業資料倉儲,反之亦然。假設一個公司採取數個資料超市同時存在的模式,在定義相同維度的資料時發生歧異的狀況,將會使資料市集變成資料孤島(Data Island)。資料孤島對企業整體而言有很大的問題,整合的功用只限於部門群組,無法擴及整體資訊的統合,跨部門的資料分析無法進行,不同工作屬性無法連結的狀況下,如果有不同的跨部門資料分析,以往資料市集架構只能繼續以疊床架屋的方式累加,無法整合。

現今資料倉儲的建置,仍以資料市集開始居多,因為資料市集採用的維度模式比起個體關係模式容易理解,而且分析速度較快,不過仍應視企業與使用者的需求而定。

虛擬資料倉儲。企業直接使用現有營運的資料庫,並輔助一些中介工具,進行有效資料處理,建構較快速,成功的機會高,可做到即時資料分析。

混合式資料倉儲。資料市集如果以虛擬資料倉儲的方式表現,就變成混合式資料倉儲。需要的儲存空間比起企業資料倉儲少,由於資料已經儲存在一個經過正規化的資料環境,資料重組的過程會比透過應用程式讀取執行中的資料來得簡單,而且也不會影響執行中的資料庫。混合式資料倉儲也能夠應付資料市集遭遇到的資料孤島現象,透過虛擬的方式能夠彈性對應不同的需求。資料倉儲的好處

資料倉儲可以做到跨資料來源的整合,使不同資料庫的資料彼此對應連結。資訊系統的建置,固然解決了資料定時產出與立即儲存的需求,一旦企業想要從資訊系統擷取經過整合後的各式統計資訊,立即面臨到資料來源不同的問題,無法跨系統同時存取,並且無法進一步自動化加工處理分析,資料倉儲可以視為提取資料的單一窗口,透過資訊系統自動化的轉換,以減少人工交換檔案出錯的可能性。

資料倉儲的發展,初期的僅需要總合資料的檢視,之後每一筆交易資料也開始保留在資料倉儲,以便分析客層與產品之間的關係。目前除了儲存總合資料和交易資料,也保留明細資料,分析顧客的購物。

這樣的歷史進程說明,企業過去只是想知道總營業額,現在則更關切顧客如何在交易流程做出選擇。

資料倉儲常會與資料採礦、商業智慧相提並論,當運用在行銷業務時,可以用來了解顧客習性,讓企業能夠預測顧客行為,以便進行適合的促銷;在企業內部,資料倉儲可以用在內部營運情形的評估,讓高階主管從具體的資料證據,找出營運狀況不佳的癥結點。文⊙李宗翰

熱門新聞

Advertisement