趨勢科技資訊服務部資深協理沈捷明表示,只用3小時停機時間就完成資料中心轉移的關鍵是,要找出伺服器相互關連來確定轉移順序。(照片提供/趨勢科技)

圖片來源: 

iThome

機房搬家對任何企業的資訊部門而言,都是一件非常困難的挑戰,上百臺伺服器的轉移工作,往往得中斷服務數十小時,甚至1~2天才能完成。但趨勢科技在今年初,只用了3個小時的停機時間,就將位於德國慕尼黑舊資料中心的200臺伺服器,轉移到10公里外的新資料中心。負責制定全球IT策略的趨勢科技資訊服務部資深協理沈捷明表示,順利快速轉移的關鍵正是虛擬化技術。

因為原本的資料中心服務商要結束營業,趨勢科技只好將伺服器全數轉移到慕尼黑另一家服務商的資料中心。這些伺服器包括了應用程式伺服器、網站伺服器和資料庫系統等。除了資料庫系統外,趨勢利用VMware的虛擬機器線上轉移技術vMotion,來搬移其他應用系統的執行環境。

趨勢從2010年底開始進行這項搬家任務,沈捷明表示,事前要先備妥網路架構,包括從控制辦公室到新舊2座資料中心的網路連線,另外還特別租用了一條10Gb頻寬的專用線路,以供虛擬機器線上轉移之用。接著,趨勢團隊用了一個月的時間來進行伺服器轉移的練習,同時測試可行性。

雖然vMotion功能可以在短短數秒內,將虛擬機器轉移到另一臺實體伺服器上,使用者可能都還沒有察覺服務已經轉移,但是,沈捷明表示,了解這批伺服器之間的關聯性,確認哪些伺服器必須先轉移,而哪些必須最後轉移。「找出轉移順序才能降低停機時間。」

例如,有些網頁服務建置了多套前端應用系統來分散流量,就可以先轉移其中一套系統的虛擬機器到新資料中心,再轉移後端的資料庫。只要將新的網頁系統重新連結新的資料庫後就能啟用服務,再逐步轉移剩下的前端應用系統。

沈捷明表示,已建置備援系統的服務,也可以如法炮製,先轉移一套系統到新機房接手提供服務,再陸續轉移其他系統。若是沒有建置備援的服務,則是要先產生一個暫時性的伺服器來轉移。最後,趨勢啟用這些透過vMotion轉移成功的服務後,才會進行DNS切換,讓遠端使用者真的連結到新資料中心的伺服器上使用各項服務。

轉移過程中,沈捷明表示,要先計算出需要的虛擬機器數量,並且事先備妥實體伺服器,趨勢趁機將部分網頁應用整併到同一臺效能更強的實體伺服器。

用Single VM作法快速轉移非網頁應用

其他非網頁的應用程式則是採取1對1的轉移方式,將舊機房的實體伺服器,先透過P2V工具將執行環境轉移到虛擬機器中,再使用vMotion將虛擬機器轉移到新機房中只執行單一虛擬機器(Single VM)的實體伺服器上,也就是說,在新資料中心裡,同樣由一臺實體伺服器來執行這個服務,只是多了一個虛擬機器和虛擬層的負載。例如最後轉移的資料庫系統,就是採取Single VM的轉移方法。

趨勢最後才轉移資料庫系統,沈捷明表示,因為vMotion轉移的作法需要在新舊資料中心各準備一套資料庫系統的授權,會產生額外的授權費用,所以,資料庫系統採取停機轉移的作法,而不是透過vMotion線上轉移。這個停機轉移,也是先將資料庫系統轉移到虛擬機器中,再停機將這個虛擬機器的映像檔複製到新資料中心的伺服器中啟用,並且搭配具有重複資料刪除功能的網路加速設備來減少資料傳輸量,盡可能地縮短停機時間。這次資料中心搬家的3小時停機,就是為了轉移資料庫系統。

透過事前充分的準備和規畫,再加上執行團隊擁有豐富的虛擬化導入經驗,趨勢順利在今年1月完成這項資料中心的轉移任務。

執行團隊的虛擬化經驗並非憑空產生,而是趨勢過去幾年推動虛擬化累積的成果。早從2007年,趨勢科技就開始嘗試虛擬化,最初花了6個月到1年時間驗證虛擬化應用的可行性,同時累積足夠的自行導入經驗。

例如2008年中時,臺灣趨勢就將150臺編譯伺服器,整併到5臺實體伺服器中,後來更擴大將虛擬化架構應用到上千臺的測試伺服器,一方面加快測試環境的提供,另一方面也整併老舊的測試伺服器。沈捷明表示,透過這些先期導入計畫,讓虛擬化技術逐漸獲得使用者部門和業務部門的信賴。

2009年後,趨勢開始將各種應用系統虛擬化,除了測試環境外,還包括了ERP、CRM、財務系統、OA系統等應用。將160個機櫃的伺服器,整併為100多櫃,節省了不少機房空間。

2010年下半年時,趨勢更進一步發布政策,規定所有新開發的應用系統都要使用虛擬機器,除非有特殊考量。當時趨勢科技虛擬化比例已高達45%,虛擬機器的數量達到3,000臺之多,平均1臺實體伺服器可以承載5~10臺虛擬機器。沈捷明表示,今年目標是在年底前達到80~85%的虛擬化比例。

建立自動化服務平臺提高虛擬機器配置效率

為了管理數量高達數千臺的虛擬機器,趨勢在2010年初也展開了一項Instant VM專案,自行打造了一個自助式的虛擬機器部署平臺,讓虛擬機器的調配可以自動化。

Instant VM的使用者是負責評估專案需求的專案經理,當他需要申請虛擬機器時,可以自己到Instant VM的網頁上填寫申請單,描述專案所打造的應用系統用途、專案期程、應用程式屬性,例如是處理器消耗型、記憶體消耗型或是I/O消耗型?總共需要多少臺虛擬機器?需不需要提供自動備份和回復功能?若需要備份,備份頻率是每日、每周或其他?以及是否需要提供虛擬機器使用量報告資料等。

Instant VM會依據申請單內容,自動調度和配置虛擬機器,同時建立備份和回復機制的設定檔,讓備份儲存系統可以依據設定來維護虛擬機器。

趨勢在每年的年度計畫中,都會要求各專案經理先提出今年計畫專案的虛擬機器容量需求,以供虛擬平臺管理人員事先預估今年需要採購的實體伺服器與儲存系統的容量。不過,沈捷明表示,自動化服務一定要搭配資源回收機制,才不會是跛腳的自動化,否則再多的資源也很容易用完。所以,Instant VM也搭配了資源回收功能,專案完成後就回收臨時性的虛擬機器,例如開發階段或測試階段使用的虛擬機器,而正式上線環境的虛擬機器則不需要回收。

過去,趨勢科技基礎架構維運人員需要1周才能提供專案所需的執行環境,導入虛擬化之後縮短到2小時就能完成虛擬機器的部署,而透過Instant VM自動化配置平臺,更能在1小時內完成提供。

專案經理使用自助服務是為了更容易取得使用量報表

不過,對專案經理而言,沈捷明表示,他們願意使用自助式服務的動機,是可以很容易取得使用量的報告。過去,專案經理需要各種執行環境使用量資訊,例如伺服器使用量、網路使用量時,必須額外花時間向不同的IT維運負責窗口申請。但現在,Instant VM結合了報表系統,會自動將各種使用量監控資訊寄送到專案經理的電子郵件中,專案經理比以前更容易取得各種平臺管理資訊。

目前,趨勢科技正展開Instant VM 2.0的改版計畫,除了增強更多監控功能,涵蓋更多網路效能和磁碟容量管理機制與監控資訊,還希望能整合更多虛擬化技術,自動配置不同虛擬化技術的虛擬機器資源,除了VMware以外,還能自動配置微軟Hyper-V和Citrix平臺。

除此之外,趨勢科技還希望能結合過去各種應用程式的使用量趨勢,來提供應用系統的使用量預測,協助專案經理規畫未來需要的容量,例如在特定事件時,需要額外準備多少虛擬機器才足以承載突然暴增的用量。

雖然預測數據只是參考值,但沈捷明認為,透過這些監控工具提供的使用量透明度,系統管理者就可以結合過去經驗,來判斷未來特定事件需要的運算容量,例如出現新的攻擊木馬,或是病毒碼更新等情況時,可以預先管理這些事件帶來的可能衝擊,這正是他認為系統管理者最重要的價值。

 


相關報導請參考「私有雲實踐術

熱門新聞

Advertisement