Build 2018：微軟認知服務大更新，提供企業更多將產品AI化的工具

在圖像中框住指定的物件，定義標籤，以訓練客製化視覺模型Custom Vision辨識特定物品的能力。

圖片來源:

微軟

微軟近日於2018年的Build大會上公開Azure平臺上認知服務的更新，包含統一的語音服務、Bing視覺搜尋、客製物體偵測模型等。

首先在視覺類型的服務中，微軟現在的電腦視覺服務整合了改良過的OCR英文模型，為圖片加上說明文字的服務也多支援了簡體中文、日文、西班牙文和巴西葡萄牙文。

客製化視覺模型Custom Vision現在不但可以識別出特定圖片的類別，還能偵測物體，開發人員可以透過Custom Vision來訓練可辨識出物體具體位置的模型，微軟提供3種格式下載Custom Vision，包含TensorFlow、CoreML和ONNX。

在語音和機器翻譯的服務中，微軟發表了統一的語音服務預覽版Unified Speech service，在語音轉文字、文字轉語音，以及機器翻譯都有更新。

另外，微軟也針對搜尋引擎Bing進行改善（下圖，來源：微軟），視覺搜尋Bing Visual Search讓用戶能夠以圖搜圖，輸入特定的圖片，找到類似的商品，也能識別出圖片中的條碼、文字和名人。

微軟相信任何開發人員都要可以將AI技術，整合到App和服務中，因此微軟在三年前推出認知服務並持續投資AI技術，藉由認知服務提供開發人員簡單的工具，只需要寫幾行程式碼，就能將電腦視覺、語音辨識、自然語言理解等技術，加入自家的App或是服務中。

熱門新聞