如何讓資料庫主力產品符合生成式AI(GAI)掀起的快速、高可用需求,是AWS今年度re:Invent大會想展示給業界的內容。
自AWS推出資料庫服務以來,歷經了第一代的雲端資料庫服務Amazon RDS,後來也發展出2款主要服務Amazon DynamoDB和Amazon Aurora,前者是全託管、無伺服器、鍵值NoSQL資料庫,使用者可用來任意擴展、執行高效能應用程式,還能持續備份、自動多區域複寫。後者則是專為雲端建置的關聯式資料庫管理系統,與MySQL和PostgreSQL完全相容,一樣具有高擴展和99.99%的可用性。
在這個基礎上,AWS看準生成式AI資料處理需求,近期在該服務中新添了不少功能,能自動擴展、支援向量資料,來協助使用者發展生成式AI應用。
如何兼顧99.999%多區域可用性和強大一致性
AWS資料庫團隊在思考產品策略下一步時,提問了「完美的資料庫服務應該長怎樣?」AWS執行長Matt Garman在大會中指出,他們於是找來不少企業客戶討論,最終總結出幾個特點:高可用性、多地區、低延遲、無需額外操作、儲存一致、懂SQL語意等。
AWS希望資料庫服務能兼顧所有優點,於是針對這些項目一一研究、改進。尤其針對一致性,AWS開發一種方法,來將資料庫交易處理和儲存進行解耦,只在交易提交時進行一次性檢查,並平行處理所有區域的寫入工作,減少了不同區域間,資料庫引擎同步所需的繁瑣資料交易量,進而提高一致性和快速寫入多區域資料庫服務。
但如何讓這些資料交易,都按照時序寫入,又是另一個難題。於是,AWS自己開發了Amazon Time Sync時間同步服務,來在世界各地的每個雲端伺服器EC2執行個體中,部署硬體參考時鐘,並與衛星原子時鐘同步。
這麼做,讓世界各地的執行個體時間同步精確度到微秒等級,等於資料庫的交易資料也能精準地按時序寫入多區域資料庫,使用者更能大規模建置全球性的分散式應用程式。AWS這兩招,解決了分散式資料庫領域長期存在的兩大挑戰。
2款資料庫服務新功能登場
因為這些技術突破,AWS將兼顧分散式資料庫一致性與時序的技術,進一步用來打造2款新功能,專門為全球性應用程式設計,更能滿足AI分析應用的快速需求。
這就是Amazon Aurora DSQL和Amazon DynamoDB Global Tables。Matt Garman自信地說,Amazon Aurora DSQL具備是最快的無伺服器分散式SQL資料庫,使用者可建立99.999%多區域可用、高度一致且PostgreSQL相容的應用程式,而且不必管理基礎設施。
這個新功能採AA架構,具自動故障恢復功能,確保應用程式能在Amazon Aurora DSQL任一端點進行讀寫,運作不中斷。也由於多區域可用,在一個區域寫入的交易,都能即時同步到其他區域,達到高一致性。尤其,Aurora DSQL的讀寫速度比市面資料庫服務快上4倍,適合打造全球性的分散式應用程式。
有了Aurora DSQL的技術突破成功經驗,AWS也用來打造Amazon DynamoDB Global Tables新功能,在多區域高可用、低延遲的基礎上,進一步強化一致性,能確保用戶在多區域部署的應用程式,一直讀取最新資料,不必更改任何應用程式碼,更利於跨國應用程式執行。這兩款新功能是AWS為AI龐大資料處理需求,給出的新解方。
熱門新聞
2024-12-19
2024-11-29
2024-12-16
2024-11-20
2024-11-15
2024-11-15