國泰金控
「從一家子公司到協助集團各公司上雲,從一套系統發展到上百套系統上雲」國泰金控數數發中心雲端技術架構師顏勝豪直言,這正是國泰金控集團所要面對的大規模上雲的考驗。
為了克服這項IT大挑戰,該公司不只擬定大規模上雲策略,還建立一套方法論,來協助各子公司進行大量系統遷移,更透過系統化方式幫助子公司評估,加快上雲腳步。而顏勝豪正是負責執行集團雲端轉型計畫的關鍵人物,擬定集團上雲策略。他近日在一場活動上首度揭露集團內部大規模上雲的轉型歷程。
目標3~5年完成全集團100套系統上雲
早在幾年前,國泰就已經展開集團上雲旅程,開始將一些新系統和服務部署於地端的私有雲,更要建立私雲和公雲的混合雲架構,以取得雲端更多好處,包含敏捷、彈性、全球部署和成本優勢。而國泰雲端戰略第一步,就是要把集團內系統逐一搬上公雲,還擬定上雲策略,希望透過雲環境就緒(Cloud Readiness)、雲端採用(Cloud Adoption)、雲端優化(Cloud Optimization)及雲端應用現代化(Cloud Modernization)分4階段,完成集團上雲。
國泰擁抱雲端,不只是想要獲取上雲效益,更希望利用雲端資源協助集團建構國泰雲端數位發展能力,這些能力都是國泰金控數位轉型整體戰略的重要一環。在這個大戰略之下,顏勝豪和數數發團隊一肩扛起重任,要協助集團各子公司完成系統遷移,更以未來3~5年完成全集團100套系統上雲為目標。
國泰於2021年展開第一階段上雲計畫,從基礎建設、應用程式、管理、組織4個面向發展上雲的準備,先從銀行開始,之後人壽、產險、證券子公司跟進。
顏勝豪表示,這階段上雲的重點,先從子公司單一系統上雲做起,以建立搬遷雲端所需的相關資安、系統遷移和環境基礎設計機制,完成第一階段目標後,今年進到第2階段雲端採用。
國泰實現大規模上雲的關鍵,靠一套方法論協助子公司做遷移分類
但一進到這個階段,國泰數數發團隊馬上遇到考驗,因為需要處理子公司越來越多大量系統上雲的需求,尤其,跟過去上一套系統相比,顏勝豪指出:「進入大量雲端使用階段,面對的是上百套系統的挑戰,其複雜度、規模和以往截然不同。」
他進一步解釋,因為每套上雲系統架構都不一樣,有些可能採用傳統單體架構,有的則導入微服務新架構,甚至相依性 、開發架構、SLA要求,每個系統都不一樣,不僅如此,有時還得考量有無個資、特殊大流量需求等,這些都會影響到其上雲模式,「100套系統中可能就有50種不同的類別 ,必須要有對應策略。」
國泰金控實現大規模上雲的策略關鍵,就是靠一套方法論,來協助各子公司進行大量系統遷移。他們將系統遷移方式依據上雲模式、系統開發成本分為Rehost 、Re-platform、Refactor、Rewrite、Replace和Retain共6種遷移架構,對應到IaaS、PaaS、SaaS三種不同上雲模式。圖片來源:國泰金控
國泰金控實現大規模上雲的策略關鍵,就是靠一套統一的方法論,協助各子公司進行大量系統遷移。
但不像其他企業大多使用現成方法論來實踐,國泰反而選擇自建集團自己的方法論,除了透過顧問團隊協助,還參考Gartner 5R和AWS 7 Rs雲端遷移模型定義,進而形成自己的Cathay 6R雲端遷移方法論。顏勝豪表示,以此建立出來的方法論,更能夠符合國泰金融上雲實際情況。
在這套方法論中,他們將系統遷移方式依據上雲模式、系統開發成本分為Rehost 、Re-platform、Refactor、Rewrite、Replace和Retain共6種遷移架構,並能對應到IaaS、PaaS、SaaS三種不同上雲模式。
在這6種上雲方式中,採用Rehost方式上雲的系統開發成本最低,幾乎不需改動,僅需將本地VM搬上雲,常見的工作負載平移(lift and shift),就是屬於這種上雲方式。而Re-platform則是指在系統上雲過程中開始採用雲生原應用服務,如改用雲端代管服務提供SQL資料庫服務等,或將應用程式容器化。Refactor則是Re-platform更進階作法,不光是資料庫,連AP層跟著容器化,部署在雲端容器管理平臺上,它也是第三種上雲方式。
該方法論提到第四種上雲方式是Rewrite,相較於前三種上雲方式,不光是改寫應用程式,連系統架構也進行大幅更改,轉為Cloud Native架構,如將前端網頁從MVC架構改為前後端分離的SPA單頁式應用架構。他指出,這種上雲作法,雖然更能支援雲端原生環境,但系統開發成本相對較高。如果採用Replace方式上雲的話,對轉換雲原生架構更徹底,等於是全面改以SaaS服務型態進行上雲。最後Retain作法則因考慮到合規性、系統合併等不確定因素,系統仍維持於地端。
國泰今年在進行大規模系統上雲時,開始透過這套方法論,來對於這些上雲系統進行分析、分類,找出其適合上雲的方式,確保整個遷雲過程能順利完成。
顏勝豪表示,雖然系統上雲有更快交付市場、資源申縮彈性、省錢、天然高可用等諸多好處,但獲得這些好處的前提,取決於系統如何上雲,「6R方法論的實踐很重要,因為它不只決定整套系統上雲後的服務顆粒度大小,甚至影響到之後上雲效益。」
舉例來說,在6R方法論中,採用不同遷移方式,對應到的上雲模式有所不同,比如Rehost分類對應到的上雲模式是IaaS,Re-platform和Refactor上雲模式則是IaaS或PaaS,而Rewrite對應到的是PaaS或SaaS,至於Replace則屬於SaaS模式。
但對國泰系統上雲來說,他強調,最終希望是採用PaaS或SaaS方式上雲,大量使用虛擬機的IaaS模式雖是最快又簡單的上雲方法,但獲得的雲端效益也最低。顏勝豪更用一句話直白說明 Cathay 6R 策略:「就是消滅虛擬機」。
也因為採取這個策略,目前國泰系統上雲過程中,如果各子公司提交的系統架構圖出現VM,他會特別詢問理由,除非這些應用只能在VM上執行,不然會要求子公司盡量避免使用VM,改用容器來取代。
導入自評系統,加快子公司系統上雲評估
有了6R方法論之後,他表示,執行上,團隊會透過系統訪談,依據所收集到的資訊,產出該系統上雲的評估建議,包括技術、風險、業務衝擊等面向,作為各子公司系統上雲的參考。經過他們的歸類,目前系統上雲方式以Refactor的分類情況最常見,也就是屬於低度應用程式的調整,可能採用PaaS服務或者把應用程式容器化。
為了縮短系統上雲評估作業,國泰後來自行開發一個CCMA(國泰系統上雲評估分析平臺)系統,將6R分類方法轉為系統化方式,來協助各子公司評估,除了協助其快速了解應用系統的資料性質、開發者、資安需求等等,也提供子公司作為整體應用遷移策略的選擇參考。
顏勝豪表示,過去透過Excel進行資料蒐集和整理,產出分析結果和報表,容易有資料保存版本的問題,導入系統後不再有這個問題,甚至子公司IT團隊能上網站預填問卷,不需要等訪談人員到現場才能填,有助於縮短系統的評估時間。問卷填完的數據分析結果,從系統上就能看得到,他們將原本人工邏輯判斷,轉為規則引擎建立在系統裡,只要填妥資料,系統就會產出6R評估結果。所有報表經過系統化,都可以直接匯出,方便各子公司來查看。
像從系統上的問卷管理平臺,就能看到每個上雲系統的列表和上雲評估,在列表中,除了有6R評估結果,還提供風險、業務衝擊、技術適合度等不同面向的系統分數和整體平均分數比較,作為各子公司總體上雲策略的判斷,另外也整合不少分析功能,像是透過整體分群分析,可以觀看不同上雲系統在空間分布上的點位,有助於做上雲分類的判斷,該系統還提供參數分析功能,可提供子公司決定如何上雲,甚至上雲優先順序的建議。
不只有參數分析和圖表,針對每一套系統,數數發團隊還會提供質化分析報告,包含系統是否適合上雲的種種因素,供各子公司IT團隊參考。
除了設計統一方法論,應對大規模上雲的挑戰,顏勝豪表示,接下來將把雲端成本控管,和上雲後的Day-2 Operation維運面問題納入關鍵考量。
熱門新聞
2024-11-18
2024-11-20
2024-11-12
2024-11-15
2024-11-15
2024-11-19