國立台灣大學身為高等教育的第一學府,肩負的使命不僅是作育英才,在瞬息萬變的資訊科技浪潮下,台灣大學提供的資訊服務,更是國內所有大專校院與研究機構的指標。台灣大學計算機及資訊網路中心(以下簡稱台大計中)在孫雅麗主任的領導下,於2009年率先評估導入雲端運算技術,並於次年開始規畫國內首件大型雲端運算專案-台大斛斗雲(NTU Cloud),目前已成功完成五大服務的上線,包括提供雲端虛擬主機、讓運算資源共有共享的NTU VM;高安全性的雲端資料備份空間NTU Backup;隨時隨地可以輕鬆取得資料與訊息交換的NTU Space;使用者可以跨平台使用各式應用軟體的NTU Desktop,以及使用者可以隨時取得雲端上的授權應用程式與運算資源的NTU AppShare。
「雖然雲端運算這個熱門的關鍵字可謂人云亦云、眾說紛云,它彰顯出的IT資源集中、有效運用、共有共享、用多少付多少的概念,的確是人們所需要、同時也是資訊管理者所嚮往的目標。」台大計中主任孫雅麗表示:「網路通訊技術的進步實現了雲端運算的各種可能,使用者能在各式各樣的終端裝置上,以更低的代價獲取更優質的服務;對於提供雲端運算服務資訊管理者而言,資源集中意味著更多的應用伺服器需求、更多元複雜的基礎架構以及更快的資料增長速度,如何資訊系統維持穩定、可靠、高效的運作,讓台大斛斗雲能永續提供服務,是NTU Cloud團隊面臨的重要課題。」
資料不斷增長,環境日益複雜,管理難有效率
如何有效管理龐大且持續不斷增長的資料,NTU Cloud團隊在維運上的首要挑戰。台大計中的服務對象是全校3萬多名的教職員生,多年下來累計儲存在計中機房的資料量已超過1.4PB(1PB=1,024TB),承載這些資料的儲存裝置也超過5個品牌,環境非常複雜,管理上十分棘手。舉例來說,每當磁碟儲存系統(RAID system)擴充或汰舊換新時,就必須在不同的儲存裝置之間做大量的資料搬移,勢必面臨效能下滑、甚至是停機導致服務品質降低的問題。此外,企業級的磁碟儲存系統價格昂貴,採購決策時考量到預算有限,勢必要取得效能與成本間的平衡;新的儲存系統也必須符合雲端運算對可靠度的嚴格要求,不能因為採用的是價格相對較低的國產品牌儲存設備,就犧牲了系統的穩定性。
「台大斛斗雲後端機房的建置與管理複雜度非常高,專職負責此案的人員卻很少,面對接踵而來的資料儲存管理難題,管理者需要合適的工具來協助提升管理效率。」孫雅麗表示:「NTU Cloud團隊同仁經過仔細的評估與測試,認為DataCore SANsymphony-V這套儲存管理方案,能協助維運台大計中斛斗雲後端龐大複雜的儲存系統。」
用儲存虛擬化突破儲存管理僵局
SANsymphony-V是一套基於開放平台的儲存虛擬化軟體,它可以介接儲存區域網路(SAN)環境中,將不同品牌的儲存設備以獨有的「Storage Hypervisor」技術整合成虛擬化的儲存池(Storage Pool),提供前端應用伺服器的容量管理(Capacity Management)、效能管理(Performance Management)、資料保護管理(Data Protection Management)等三種服務。
台大計中首先將SANsymphony-V應用在斛斗雲中儲存容量需求最大的NTU Space,將所有品牌、新舊不同的磁碟儲存系統納入SANsymphony-V管理。在容量管理部份,以台大計中新一代的電子郵件服務NTU Mail 2.0為例,由於早期採購的儲存系統效能已經不敷所需,必須逐步將龐大的mailbox資料移轉至新採購的高速儲存系統,並將舊的移做儲存備份資料之用。這個看似簡單的資料搬移過程,卻是要在完全不影響整個電子郵件系統運作的前提下完成,在SANsymphony-V的協助下,台大計中僅以一位管理者就達成這項艱鉅的任務。
此外,SANsymphony-V的Storage Caching快取技術,也相當程度的提升了斛斗雲的儲存效能。NTU Cloud團隊成員就以自身的經驗表示,在導入之前開一個VM須要幾分鐘的時間,經過SANsymphony-V優化I/O效能後,現在只要十幾秒就開機完畢上線使用。
對於台大計中最重視的系統可靠度方面,孫雅麗說:「身為資訊主管,最怕遇到問題發生後不知道如何偵錯,在虛擬化之後環境複雜度更高,更難判斷系統故障環節在哪裏,因此維持系統的穩定運行是第一要務,我們要求所有資訊設備都必須有備援機制,並能確實運作。」SANsymphony-V的HA(High Availability)高可用性儲存叢集技術,能以鏡像(mirror)兩台儲存系統間的資料並達成自動備援。NTU Cloud團隊成員在POC過程中,曾實際拔掉其中一台儲存系統的電源測試,證實SANsymphony-V HA機制能迅速切換至正常的儲存系統,讓服務不會因單點故障而中斷。
運用自動化儲存分層,實現大記憶運算
台大計中自2012年開始評估導入SANsymphony-V,已在今年逐步將NTU Space中的儲存設備納入管理,由於效益十分顯著,台大計中目前正著手將重要的校務行政系統儲存設備也併入SANsymphony-V的虛擬儲存池,未來則是計畫將SANsymphony-V的自動化儲存分層功能(Automated Storage Tiering),導入「大記憶體運算」的應用範疇。孫雅麗表示,台大有許多研究單位的研究計畫需要高速運算,像是生物科技研究所的水稻基因體排序,以及醫學院、電資學院目前正在進行的重大研究專案,礙於預算限制,不可能採購昂貴的伺服器和儲存設備。藉由SANsymphony-V的自動化儲存分層技術,將單位時間內存取次數較高的磁碟區塊被存放於較高速的儲存裝置,結合日益普及的固態硬碟(SSD)做為第一層(Tier-1)儲存裝置,由於SSD的I/O效能已經和記憶體相去不遠,可擴充的儲存容量卻比記憶體大得多,運用這項技術,就能以較低的成本取得大記憶體運算所需的儲存效能。
「雲端運算已經是資訊界不可抵擋的潮流,因為斛斗雲的成功經驗,不僅許多大專院校紛紛計畫或著手建置私有雲,如行政院衛生署等政府單位,也紛紛向台大計中取經,做為未來邁入雲端運算的重要參考。」孫雅麗認為雲端運算的最終目標,是將所有的資料、應用程式、運算能力全部放在雲端,將終端使用者的負荷降至最低,這也意味著所有資料和運算資源全都集中在雲端機房,管理者的維運能力將是關鍵。如同VMware、Hyper-V等軟體為核心的伺服器虛擬化技術,將雲端伺服器的維運化繁為簡,儲存虛擬化技術也能將磁碟儲存系統的擴充性、可靠度、可管理性和效能都向上提升。DataCore SANsymphony-V這套業界最具代表性儲存虛擬化軟體,在經過台大計中斛斗雲的實際應用之後,已充份驗證它的價值。