在圖像中框住指定的物件,定義標籤,以訓練客製化視覺模型Custom Vision辨識特定物品的能力。

圖片來源: 

微軟

微軟近日於2018年的Build大會上公開Azure平臺上認知服務的更新,包含統一的語音服務、Bing視覺搜尋、客製物體偵測模型等。

首先在視覺類型的服務中,微軟現在的電腦視覺服務整合了改良過的OCR英文模型,為圖片加上說明文字的服務也多支援了簡體中文、日文、西班牙文和巴西葡萄牙文。

客製化視覺模型Custom Vision現在不但可以識別出特定圖片的類別,還能偵測物體,開發人員可以透過Custom Vision來訓練可辨識出物體具體位置的模型,微軟提供3種格式下載Custom Vision,包含TensorFlow、CoreML和ONNX。

在語音和機器翻譯的服務中,微軟發表了統一的語音服務預覽版Unified Speech service,在語音轉文字、文字轉語音,以及機器翻譯都有更新。

另外,微軟也針對搜尋引擎Bing進行改善(下圖,來源:微軟),視覺搜尋Bing Visual Search讓用戶能夠以圖搜圖,輸入特定的圖片,找到類似的商品,也能識別出圖片中的條碼、文字和名人。

微軟相信任何開發人員都要可以將AI技術,整合到App和服務中,因此微軟在三年前推出認知服務並持續投資AI技術,藉由認知服務提供開發人員簡單的工具,只需要寫幾行程式碼,就能將電腦視覺、語音辨識、自然語言理解等技術,加入自家的App或是服務中。

熱門新聞

Advertisement