【AWS雲端服務新戰略：AI】大舉擴充機器學習陣容，多種平臺服務上場

當前主要的公有雲廠商，都在持續發展人工智慧應用，並且提供對應的解決方案，而身為市場龍頭的AWS到了2017年底，也加緊腳步推出不同層面的平臺與服務，並強調整合多種AWS服務的優勢。

人工智慧的應用當道，使用機器學習技術的機會跟著快速增長，許多雲端服務業者都在積極發展這樣的業務，而AWS當然也不例外。

他們在底層架構的部份，提供搭配GPU的加速運算型執行個體P3，以及專門用於深度學習的一系列AMI映像檔，支援Apache MXNet、Caffe2、CNTK、PyTorch、TensorFlow、Theno、Torch等框架。而在深度學習的應用介面上，AWS也支援2015年問世的Keras（能在TensorFlow、CNTK、Theano當中執行），以及由AWS與微軟在2016年10月所共同推出的Gluon（MXNet已涵蓋在內，微軟CNTK未來版本及更多深度學習框架，也將納入）。

而在2017底年舉行的re:Invent全球用戶大會上，AWS新發表了多種機器學習相關的雲端服務項目。

推出機器學習整合服務，以及支援深度學習的視訊攝影機

在11月29日的主題演講當中，AWS執行長Andy Jassy針對機器學習平臺，首先宣布推出的服務是SageMaker，這是一套關於機器學習模型的建立、訓練與部署作業的雲端服務，由AWS全權管理，可協助應用程式的開發者、資料科學家，將發展機器學習環境所需的多項繁複操作，變得更容易。

SageMaker之所提供這樣的便利性，是因為運用了預先建好的Jupyter notebooks開發範本、針對PB等級資料集最佳化的常用機器學習演算法，以及自動模型調校等技術。而在訓練過程中，SageMaker也能予以簡化與加速，並且可以自動建立與管理所需要的IT基礎架構，用於訓練模型與執行推論，以便產生預測結果。

在深度學習框架的搭配上，SageMaker原生整合了TensorFlow和MXNet，未來將會支援更多類型，同時，開發者若在SageMaker使用特定的框架與演算法，也可以先把相關環境的容器，上傳到EC2 Container Registry容器登錄服務，再予以設定。

透過SageMaker執行訓練模型的過程，也相當簡單，開發者只需選擇EC2的執行個體類型與數量，以及資料所在位置即可，系統會幫你設定分散式運算叢集、執行模型的訓練，並將結果輸出到S3，在完成作業之後，也會自動拆散叢集。此外，這套服務提供了自動調校模型功能，裡面運用方式包括：超參數（Hyperparameters）的最佳化，以及自動調整幾千種演算法的參數組合，藉此提升預測精確度。

接續在SageMaker之後，Andy Jassy第二項關於機器學習的發布，出乎眾人意外地，竟是一臺具有WI-Fi無線上網能力、內建深度學習的視訊攝影機DeepLens，令全場與會者為之震驚。

這是一部協助開發者設計深度學習應用的設備，並可用於人員的教育訓練，AWS人工智慧事業群總經理Matt Wood也在現場利用這臺設備，直接向全場觀眾展示辨識物件圖像與臉部情緒的能力，處理速度與判斷準確性相當不錯。

Matt Wood也公布了DeepLens的售價是249美元，有意試用者，可參加re:Invent大會現場舉行的DeepLens工作坊，AWS也已經開放網站預購，可到電子商務網站amazon.com下單，預計在2018年初開始出貨。

AWS新服務降低機器學習門檻

想要獲得機器學習的能力，首先要克服的難關是相關環境的建置，而在AWS宣布推出的服務SageMaker當中，簡化了這些作業，開發者只需考慮資料模型該如何建立、訓練、部署，底層的瑣碎工作由AWS來處理。

提供更多類型的機器學習應用服務

除了SageMaker和DeepLens，AWS在圖像、語音、語言、語意的辨識服務上，也增加了新的解決方案。

在影像識別應用上，AWS先前就有Rekogntion，是針對圖片的搜尋、分析與組織，而在這次大會期間，他們推出Rekognition Video，能即時與批次分析影片，另一個則是Kinesis Video Streams，可擷取與儲存影音串流資料。

其中的Rekognition Video，可以針對用戶存放在S3雲端儲存的影片資料，追蹤裡面的人員與活動狀態，並且辨識物體、臉孔、名人與不當內容，AWS借助電腦視覺模型的力量，提供易於使用的API，而這些模型訓練的目的，就是為了能夠做到精準偵測幾千個物體與活動，並且可以針對即時錄製的視訊，以及放置在S3的影片，拆解出動作相關的脈絡。

而對於語音識別，AWS過去已推出文字轉換語音的服務Polly，以及針對應用程式提供語言和文字交談介面的服務Lex，而到了2017年底，他們增設了將語音辨識為文字的服務Transcribe，翻譯多國語文的Translate，以及具備自然語言處理能力的Comprehend。

以Transcribe為例，能夠處理音質較低的語音資料，例如通話中心的電話語音記錄，提供高精準度的分析，系統對於處理的每一個字，都會給予一個時戳（Timestamp），讓開發者對於文字與原始檔案的內容，進行精準對齊。而在多國語言的支援上，目前這套服務僅支援英文與西班牙文，至於處理其他語言的部份，未來將陸續推出。在技術的發展上，Transcribe的下個目標是針對同一個聲音檔，能夠清楚辨識出裡面的多個講者，也將提供開發者上傳自定的詞彙資料，以提升語音轉為文字的精確度。

而在Translate的服務當中，AWS運用了神經機器翻譯（Neural Machine Translation）的技術，提供精準的多國語文翻譯，初期可處理英文與6國語言之間的轉換（阿、法、德、葡、簡中、西），2018將推出更多語言的支援。

至於Comprehend，則是提供理解自然語言的能力，針對儲存在AWS雲端服務環境中的文件、社交網站的貼文、文章，以及任何文字資料，進行相關的處理。AWS在這套服務裡面，主要是運用了深度學習技術，而能辨識出多種資訊，例如：文字敘述的主體（例如人物、地點、日期、所屬的團體組織），內容撰寫採用的語言，文字表達的情緒、表達概念與形容詞的關鍵字。

AWS物聯網雲端服務的新布局

在2017年底，AWS宣布6個物聯網（IoT）雲端服務，都是針對連網設備而來的應用。首先發表的是IoT 1-Click，提供更易於建構物聯網應用的環境，針對使用者單鍵操作的連網設備，使其具有技術支援、後續添購相關商品與服務，或是資產位置追蹤等功能。

接著，AWS推出IoT Device Management、IoT Device Defender、IoT Analytics，對應連網設備的管理、安全防護，以及資料分析需求。

而對於小型、低功耗連網設備的整合運用，AWS提供Amazon FreeRTOS作業系統平臺，使設備安全連至AWS雲端服務，或是執行Greengrass的邊緣設備與閘道裝置，而開發者可以更容易建構具有通用物聯網能力的設備。

熱門新聞