回顧過去我們仍經常報導儲存陣列、NAS與伺服器產品的時代,隨著搭配硬碟儲存空間的增大,負責測試的技術編輯等待RAID建立的時間也越來越長,對此,我們的技術主筆張明德說,那時的硬碟容量大多是2 TB以下,但也需要1天才能完成RAID建立,然而這只是初始建立,後續使用若遇到硬碟失效,需更換硬碟重建RAID,也要花費一段時間進行。

現在重建硬碟RAID所需時間已達到令人難以忍受的地步。根據儲存系統廠商Dell在2017年公布的技術報告,在傳統10+2 RAID 6架構下,重建1臺3TB硬碟需51小時,重建2臺則需要100小時;Dell在2019年公布另一份白皮書則提到,以傳統8+2 RAID 6架構若要重建1臺10 TB硬碟,需等待55.5小時,而且,若1臺硬碟故障,儲存效能會降低41%,若是故障的硬碟有2臺,儲存效能則會降低62%。

而在臺灣從十幾年前到最近這幾年,也發生過幾次與硬碟毀損有關的重大事故,其服務復原處理的時間太久,似乎也和RAID重建速度過慢有關。

例如,2017年10月底,BBS討論區批踢踢實業坊(ptt.cc)發生當機,但超過3日仍未復原,起因是磁碟陣列故障、需重新設定,但由於硬碟重建需要一段時間來進行,而且站方表示,需要再備份一次,對系統進行檢查、避免資料錯誤,導致全面恢復時間延長。而此事故最終在11月3日上午10時完成,有人統計整個搶修時間長達83小時。

另一個例子是發生在2019年9月3日,主機代管業者捕夢網傳出磁碟陣列故障事故,造成用戶網站服務中斷,到了9月5日下午,該公司網站發布虛擬主機網站陸續恢復中的公告,9月7日下午宣告完全修復。至於為何需要這麼長的時間處理,他們未透露進行的過程,但硬碟RAID重建時間過長,很有可能是影響的關鍵因素之一。

為了改善上述狀況,我們持續關注市面上是否有相關產品與技術,幫助組織與業者備援,而得到的初步答案是新一代RAID。2016年9月,技術主筆張明德發表了封面故事《RAID 2.0興起》,談到以區塊虛擬化來實現分散式架構,能夠突破傳統RAID的效能瓶頸,縮短RAID重建時間,同時,也簡單介紹當時浮出檯面的4種企業級解決方案,分別是:HPE 3PAR Fast RAID、NetApp Dynamic Disk Pool、IBM DRAID、華為的RAID 2.0+。

時隔6年的現在,我們再度以《分散式RAID躍居主流儲存應用》為題,介紹更多後起之秀,以及各自的架構與應用特色

以Dell為例,本身就發展3種分散式RAID技術,包含Flex RAID、Dynamic Resiliency Engine、Dynamic Pools,以及Seagate的ADAPT;2011年成立的儲存廠商Infinidat,他們開發的InfiniRAID是支撐公司產品的三大技術基礎之一;而就整個市場的普及度而言,則以Seagate的ADAPT,以及6年前我們介紹的NetApp Dynamic Disk Pool為大宗,因為,這兩種分散式RAID技術,不只用於自家產品,也有多個廠牌的解決方案導入。

而在應用成效上,有些廠商已陸續揭露測試數據,重建RAID的時間縮短至合理範圍。例如,對於Dell PowerVault ME4/ME5所用的Seagate ADAPT,若以24臺10 TB硬碟組成群組,只需24小時重建,若群組擴大到48臺與128臺,重建時間分別為11小時與4小時。而在NetApp的分散式RAID架構中,重建1臺3 TB硬碟需8小時,重建2臺則需要12小時。

基於這樣的發展態勢來看,能否具備分散式RAID技術,顯然成為企業級儲存產品的重要指標,期盼更多從家用、中小型儲存產品起家、亟欲躋身大型企業儲存市場的廠商,應該設法提供這類功能,改善傳統硬碟RAID重建時間過久的狀況,提升恢復速度。

 相關報導  分散式RAID躍居主流儲存應用

專欄作者

熱門新聞

Advertisement