圖片來源: 

攝影/余至浩

美國拉斯維加斯現場報導】今年AWS re:Invent 2022年度大會正式邁入第11屆,超過5萬人實體到場,已恢復往日水準。今年活動重頭戲,就是29日主題演講,AWS執行長Adam Selipsky這次登臺,相較去年首次登場,大多時候都在回顧AWS在各項領域發展,如今執掌一年多,他今年對這家雲端巨頭未來發展策略,明顯有了更清晰的藍圖。在他的帶領下,AWS將以資料為主軸,透過整合、治理、安全和透明化,建立更廣闊的數據探索領域,來達成數據創新,甚至更要朝向「全解決方案」產業應用來發展。

一開場,Adam Selipsky先細數他們如何協助大型企業用AWS雲克服自身挑戰,如BMW集團用公雲打造連網汽車服務顛覆駕駛體驗,也有美國遊戲開發商Riot Games靠雲端來應付每秒50萬起事件通報與處理,提高用戶體驗以獲得更高收益。還有全球最大證券交易所Nasdaq完成關鍵核心系統上雲,用於處理金融市場證券發行業務,更多系統年底前將上雲。

不僅大型企業有用,Adam Selipsky也引用數據強調,超過8成新創獨角獸都是AWS客戶。

Adam Selipsky不只一開始就大談企業上雲經驗,他對於企業用戶的重視,也反應在今年AWS產品發布上跟往年明顯不同。AWS今年產品策略以擴大和延續為主,許多產品發布都比較是對既有服務或產品的補強,不是大更新,而是回應顧客最迫切想要的功能,雖然少了酷炫,但也意味著,他們開始深入企業應用,來一一把各種企業需求補齊。

長達2小時的主題演說,Adam Selipsky用「合適工具(Right Tools)」、「整合(Integration)」、「治理(governance)」以及「洞察(Insight)」四大主軸貫穿整場演講。他表示,面對複雜的資料規模挑戰,企業需要一套完整工具,可以處理各種資料類型,並將這些資料整合,然後提供治理和安全性,還要能夠以視覺化呈現,方便掌握和快速傳遞,來獲得對於公司業務有價值的洞察。

他所提出的這個企業數據戰略,可以說就是AWS新的產品策略,這次眾多雲端產品發布和服務更新,都是圍繞這個新策略發展,推出各種資料整合、治理、安全和透明化的服務方案。

對無伺服器布局更加完整,能夠通吃旗下所有分析服務

在工具上,AWS已提供完整資料庫、分析、ML/AI工具,協助企業做資料處理和運用。尤其在分析服務上,AWS今年對於無伺服器(Serverless) 布局更加完整了。

去年AWS在年度大會上宣布AWS資料倉儲服務Redshift能支援無伺服器服務後,其他分析服務今年也陸續開始支援,包括大數據處理平臺EMR、即時分析工具MSK,加上原本就能用於無伺服器型態的互動式查詢服務Athena、資料串流服務Kinesis、資料整合服務AWS Glue以及BI服務QuickSight,就只有搜尋和分析引擎服務OpenSearch還沒Serverless化。不過今年AWS也把這個缺口填平。雖然只有預覽版,但透過該服務,企業已經能根據工作量變化自動擴展,因應PB級數據查詢和分析任務需求,包括日誌分析、即時應用監控、點擊流量分析等。

Adam Selipsky強調:「沒有人像我們可以做到所有分析服務都能提供Serverless。」

為何Serverless對於AWS如此重要?Adam Selipsky並沒有明講,但他在去年大會上曾提到說,在他來看,雲端運算還在初期發展階段,要先把下水道工程布局布好,所以AWS是以雲還在起步的概念來布局,而Serverless就是一個重要戰略,對於Serverless持續加快布局,就是要把包括分析在內的服務都serveless化,這一步還在持續發展,但AWS先從資料分析服務著手,並用資料整合來加以擴大。

不光是提供Serverless型態,其他資料庫和分析服務這次增加不少新功能,Athena雲端互動式查詢服務整合Spark,就是其中一個重要更新,使企業可以在Athena控制臺中使用Jupyter Notebook或Athena API來構建Spark應用程式,速度比起傳統啟用做法快75倍,另外,AWS Glue資料整合服務,也加入自動化監測和管理功能提高資料品質。

不只提高資料品質,在雲端資料服務擴充性和可靠度都有所提升,像是因應叢集服務需求,DocumentDB更新後現在可以建立跨多節點的DocumentDB叢集,以獲得每秒數百萬次讀寫工作負載吞吐量,以及PB級儲存。新推出Amazon Redshit Multi-AZ預覽版服務,則是提供高可用配置設定,能跨多個可用區進行配置,讓資料倉儲也能和其他資料庫服務一樣具有高可用性。

以實現zero-ETL願景的資料整合為目標

AWS今年在資料整合也有新布局,以往要做到不同資料庫、資料倉儲的資料整合這件事,需要透過ETL(萃取、轉置、載入)流程,對於分析人員來說,太花時間,因此需要有新的資料整合方式,來加快資料運用。過去手動資料整合方式已經跟不上現在資料動態的特性跟營運快速成長,這也成了AWS想要替企業客戶解決的痛點。

為了讓資料整合能做到更無縫接軌,AWS近年幾一直想要打造一個Zero ETL的新資料整合方式,以便在分析和ML服務時,就能直接取得這些資料做分析,而不需要搬動任何資料。「我們將以實現zero-ETL未來願景為目標。」Adam Selipsky強調。

原先AWS一些資料服務就已具備zero-ETL的能力,例如AWS串流服務Amazon Kinesis就能整合資料倉儲Redshift,使企業可以第一時間取得Redshift的資料做分析與運用。不僅如此,使用SageMaker機器學習服務時,現在能直接使用Redshift和資料庫服務Athena的資料做ML訓練,不需要建立資料處理流程(data pipeline)或撰寫程式。或是提供聯合查詢工具(federated querying tool ),可以查詢和分析存儲在如Redshift和Athena等不同位置存放的數據。

最新推出的mazon Aurora zero ETL Integration with Redshift服務,更讓AWS朝向實現zero-ETL邁出更大一步,徹底無縫整合兩大數據雲端服務Aurora與Redshift的資料。透過這項新服務,每次只要有新資料寫入Aurora資料庫中,資料就會直接同步到Redshift資料倉儲,不需要重新建立和執行繁鎖ETL流程。這種zero-ETL資料整合方式,也讓企業在Redshift實例中更多了一種資料分析來源,能從Aurora資料庫叢集的數據分析,來獲得跨多應用的整體洞察。

AWS對於資料倉儲的布局,也跨到整合串流大數據分析領域的主流平臺Spark,使企業以後想要在Redshift上構建和執行Spark應用變得更容易,不需要使用第三方Apache Spark 連接器,就能快速取得Redshift中的資料,來提供Amazon EMR做為大數據分析應用,甚至也能讓更多AWS分析和ML服務來使用。

不光如此,Redshift在資料安全管控上也有加強,現在也能利用AWS Lake Formation資料湖治理功能,使Redshift數據共享達到顆粒度更高的權限控管,可以針對單一欄或欄,來設定不同角色的存取權限,進而提高資料安全性。這也是AWS端到端資料治理策略一環。

在AI產品發展上,AWS延續去年端到端的資料戰略,AWS從去年就已經建構更加完整的機器學習和AI服務,從底層機器學習框架及基礎架構,到機器學習訓練環境全託管服務SageMaker,以及上層AI服務。

雖然這次SageMaker服務沒有重大更新,大多是一些補強功能,但也持續加強SageMaker服務完整性,像是新增ML Governance功能,可以讓端到端ML開發過程中,開始能夠結合治理和審計功能,來幫助企業解決ML治理的挑戰。對於機器學習模型建立,現在也可以支援使用地理空間的資料,來建立、訓練和部署相關ML模型。

而在No code服務上,AWS針對No code的QA工具Quicksight Q推出新功能,不只是能以自然語言進行提問,還能讓使用者可以用「為什麼」來發問,再根據機器學習模型得到預測和分析的結果,給出建議或答案。而透過採用這個方式,可以降低專業IT或資料科學家的負擔,讓更多非專業素人更容易運用AI。

借助Amazon電商供應鏈多年經驗,推出雲端供應鏈管理新服務

在產業應用上,AWS也開始朝向全解決方案發展,這次新推出的AWS Supply Chain雲端供應鏈管理服務,就是瞄準全產業供應鏈管理需求。目前仍是預覽版,但AWS強調,透過這套服務,企業未來可以自動組合和分析跨多個供應鏈系統的數據。這套服務更是借助了Amazon電商物流供應鏈多年經驗與技術發展而來,但不限於電商,其他行業也能用。

更進一步來說,企業能使用該應用服務內建的連接器,建立統一供應鏈數據湖,該連接器運用Amazon在供應鏈預先訓練完的機器學習模型,來匯整從ERP和供應鏈管理系統中取得的所有數據,並以視覺化呈現,除了方便相關負責人隨時查看庫存變化,也能以此建立風險預警機制,一旦辨識為潛在高風險情況,就能提供警訊給負責人員,提前採取避險行動。

採用業者目前有全美最大天然及有機食品超市Whole Foods Market、美國廚具供應商Lifetime Brands以及燒烤設備製造業者Traeger Grills。該服務將會在美國、歐洲上線,其他地區陸續也將推出。

另外在安全方面,AWS推出名為Amazon Security Lake的安全數據湖服務,可以協助企業組織聚集、管理和分析日誌和事件數據,包含AWS和其他合作廠商的數據,讓整個威脅檢測、調查和事件應變速度能更加提升。新的數據管理服務DataZone,則使企業能夠很快對儲存在AWS中的數據進行目錄編制、探索、共享和管理,確保資料來源是安全且可信 。在GuardDuty EKS Protection防護服務上,新增對於容器runtime威脅偵測功能。

在基礎設施也迎來不少更新,AWS目前超過600種運算實例類型,涵蓋一般用途、運算優化、記憶體優化、儲存優化、爆漲型效能及加速硬體等,AWS這次也發布採用新一代Nitro系統和Graviton處理器的執行個體服務。

Nitro是AWS打造的EC2執行個體基礎平臺,歷經4代改版後,新一代Nitro大幅提高網路傳輸能力,每秒封包傳輸速度較前一代提高60%,反應速度加快30%,每瓦效能也有獲得40%改善。AWS還更新Graviton產品,儘管未是如外界預期Graviton4,而是改推出一款經改良的Graviton3E處理器晶片,但是該款處理器的向量指令性能表現,較前一代Graviton3能再提高30%,可適用於HPC應用場景。

AWS運用Graviton3E和Nitro推出多個執行個體服務,包含能支援200Gbps超大網路頻寬的C7gn,還有推出高效能運算專用的Hpc7G等。AWS這次也更新x86架構EC2實例,推出名為R7iz的新類型,能夠支援第4代Intel Xeon Scalable處理器,使每個vCPU效能比z1d再提升20%。C7gn、R7iz先推預覽版,Hpc7G最快明年才推出。

熱門新聞

Advertisement