國泰人壽公開第一階段系統上雲旅程,耗時一年將17套系統遷移上雲。(攝影:李昀璇)

去年,國泰人壽一口氣將17套系統遷移上雲,包含16套行銷活動網站和機場旅平險系統。國泰人壽行銷資訊部副理黃鴻仁近日在2024臺灣雲端大會上,以系統開發者的身分,分享系統上雲經驗。

在國泰人壽系統上雲計畫中,系統開發者的關鍵目標有三,一是在多雲環境快速遷移,二是符合內、外規範安全上雲,三是確保使用者體驗一致。黃鴻仁指出,國泰人壽資訊團隊先透過微服務、容器化架構實現快速上雲,再篩選適當工具,建立安全資料傳輸機制,歷經不斷測試和調整,確保系統穩定運行、使用者體驗一致,才正式切轉上雲。

將應用程式容器化、微服務化,確保在多雲環境快速上雲

盤點出計畫上雲的系統後,國泰人壽系統上雲的第一步,是建立容器化環境。在這個階段中,國泰人壽先在地端建立容器化平臺,確保應用程式在地端的容器化平臺上順利運作,才接著進行應用程式微服務化。黃鴻仁解釋,選擇先在地端部署容器化平臺,是為了確保系統上雲後,還能回到地端運作,「不會有家歸不得。」

在容器化過程中,黃鴻仁表示,內部在進行效能壓測時下了不少苦功,不僅要篩選適當的Web容器,也得針對Web容器進行參數調教,根據系統實際使用情境進行壓測,確保參數配置達到最佳化。

完成應用程式容器化後,國泰人壽資訊團隊接著開始進行應用程式微服務化。黃鴻仁強調,微服務僅是國泰人壽上雲的手段,不是系統改造的目標。所以,國泰人壽將活動網站資料庫依業務別拆分,來達到上雲最佳化。

為了確認系統運作依舊順暢,國泰人壽資訊團隊除了進行系統壓測,也導入可觀測性平臺,追蹤各個服務的運作狀態。

和非IT人員檢視雲端架構合規性,新增共用元件實現雲地不同配置

完成應用程式微服務、容器化後,下一步是建立雲端環境。黃鴻仁表示,為了確保系統合規遷移,公司內部找來法遵、法務和風管等非IT人員,一同檢視資料傳輸和儲存等流程是否符合內外規範,「這是一個很重要的部分。」他強調,國泰人壽在選定部署雲端環境的工具時,特別重視供應商綁定問題,同時,也會留意資料傳輸是否採用適當加密機制。

在建立雲端環境的環節中,國泰人壽資訊團隊負責調整資料處理和傳輸機制。黃鴻仁說明團隊進行的兩項重大調整。

首先,在選用雲端環境的訊息處理服務時,國泰人壽資訊團隊並未採用地端使用的Kafka,而是採用Pub/Sub服務。其中,費用是主要考量原因。

黃鴻仁解釋,由於自家採用的公雲業者並未提供Kafka服務,需要透過虛擬機模式或購買第三方服務來裝設Kafka。綜合比較後,團隊選擇費用較低的模式,在雲端採用Pub/Sub服務,地端則使用Kafka。

另外一項重大調整,是客制化處理雲端內容傳遞網路服務(Cloud CDN)。黃鴻仁解釋,行銷活動網站包含客戶資訊,需要透過存取控管措施,來確保資料安全性,但Cloud CDN服務本身並不具備存取控管措施,若直接將客戶資料放入CDN服務,可能產生資安風險。因此,團隊在雲端環境額外設立篩選措施,確保機敏資訊不會直接存入Cloud CDN服務。

國泰人壽資訊團隊如何做到快速調整每個應用程式,同時確保雲地採用不同工具和機制?他們的作法,是在應用程式底層新增共用元件來達成。黃鴻仁解釋,共用元件能根據地端或雲端配置檔,來判斷特定環境該存取的資源,包括資料庫、檔案、訊息處理服務等。這麼一來,系統開發者就能在不同環境中採用不同工具和機制,還能透過修改共用元件,快速調整所有應用程式。

國泰人壽透過新增共用元件,來讓應用程式能根據雲端或地端配置檔,執行不同服務和機制。(攝影:李昀璇)

不斷測試、調整,確保使用者體驗一致

國泰人壽系統上雲的最後一哩路,是進行測試和調整,確保系統在雲端的使用者體驗不會變差。「不只要確保功能面沒問題,效能也得一致。」黃鴻仁強調。

國泰人壽資訊團隊在測試階段進行包括服務整合測試、功能驗測、效能壓測和安全防護等。其中,黃鴻仁強調,測試腳本需要重複執行,才能確保雲地能得到相同測試結果。在進行功能驗測時,國泰人壽資訊團隊除了從內網進行測試,也從外網模擬使用者行為,確保系統功能穩定運作。

在測試階段中,黃鴻仁提到,雲端供應商提供的應用程式及網站保護機制,與地端保護產品不同,「包含資安情況敏感程度、白名單設置方式和規則,都和地端服務不同。」因此,團隊在這個項目花費了最多精力調整、測試各種情境。

根據既有工作流程篩選雲端維運工具

在切轉上雲前,還得建立維運工具。針對雲端維運機制,黃鴻仁特別提醒,雲端具備許多功能豐富的維運工具,「但工具未必能適切結合公司既有工作流程。」

所以,國泰人壽資訊團隊在導入維運工具時,首先看重工具與既有工作流程的融合度。他們除了採用地端既有的維運工具,也將雲端上的維運工具結合至既有工作流程,確保組織內維運人員能在短時間內上手。此外,國泰人壽資訊團隊也新增可觀測性平臺,建立更全面的雲端維運機制。

最後,在正式切轉當下,黃鴻仁強調,團隊每一步都會進行測試,確保沒有問題,才進行下一步。切轉完成後,團隊會針對切轉期間不順暢項目進行討論和精進,並持續追蹤檢核事項和監控機制。

更正啟事(2024/8/1):原文多處提及行銷資訊部團隊負責執行部分系統上雲工作,國泰人壽來信說明,系統上雲工作是由國泰人壽資訊部門共同執行,而非僅由行銷資訊部門負責執行,故內文改以國泰人壽資訊部門稱呼,內文已更正

熱門新聞

Advertisement