臉書在去年的時候釋出了物體辨識開發函式庫Detectron,現在臉書重新以PyTorch改寫釋出Detectron2,新版本支援了多種新模型和功能,並把訓練工作管線移到了GPU,讓新版本的模型訓練速度比Detectron快上許多,另外還採用了模組化設計,更靈活也更容易擴充。

Detectron是臉書人工智慧研究員開發的電腦視覺函式庫,可以快速地從影片或是圖片中,辨識物體,物件的形狀和邊緣。Detectron第一個版本以Python開發,使用深度學習框架Caffe2,但是Detectron2轉換使用臉書在去年底釋出的深度學習框架PyTorch,PyTorch可提供更直觀的指令式程式設計方法,讓研究人員能快速迭代模型和實驗。

而全新的模組化設計,讓Detectron2更靈活且容易擴充,用戶可以將自定義的模組實作插入物件偵測系統各個部分中,也就是說,用戶可以方便地使用Detectron2來完成其他人工智慧研究,因為其撰寫的研究實作程式碼,可與核心Detectron2函式庫程式碼完全分離。

Detectron2除了提供Detectron中的所有模型,包括Faster R-CNN、Mask R-CNN、RetinaNet和DensePose之外,還新加入了Cascade R-CNN、Panoptic FPN和TensorMask,此外,臉書還添加了同步批次處理規範,並支援LVIS等資料集。

Detectron2支援了一系列和物體偵測有關的新功能,在原始的Detectron版本,可用框、實例分割遮罩來標出偵測到的物件,以及預測人類動作,而Detectron2增加支援語義分割,還有結合語義分割和實例分割的全景分割。臉書將Detectron2的訓練工作管線移動到GPU中,以提高整體的運作速度,現在使用者還可以將訓練分散到多個GPU伺服器,讓大型資料集的訓練工作更加快速。

臉書也實作了額外的軟體層Detectron2go,讓開發者可以更簡單地在產品中部署模型,Detectron2go的功能有內部資料集的標準訓練流程、網路量化以及為雲端和行動裝置模型轉換最佳化。

臉書設計Detectron2是要滿足自家人工智慧研究的需要,並且為臉書產品提供物體偵測的功能,像是為Facebook Portal視訊通話裝置中的智慧攝影機,提供下一代姿勢偵測功能。臉書提到,把Detectron2用做跨研究以及產品中的統一物體偵測函式庫,可以讓他們快速地把研究中的功能,轉移到大規模部署的產品模型中。

熱門新聞

Advertisement