Google最近發布了用於訓練地標辨識模型的新版資料集Landmarks-v2,比之前第一版的資料集更大,含有超過20萬個不同地標,500萬張以上的圖像,資料量是第一版的2倍,除此之外,Google還宣布兩項新的Kaggle挑戰,分別是Landmark Recognition 2019和Landmark Retrieval 2019,為了加速物體辨識的研究,還將物體辨識技術Detect-to-Retrieve開源釋出。
Google Landmarks是全世界最大的地標辨識資料集。在創建Landmarks-v2資料集的過程中,其中一項挑戰就是要為地標生成標籤,由於標記者不可能為數百萬張地標影像標記,Google透過全世界各地的攝影師一同努力,來解決這項問題,每個攝影師都熟悉他們所在地的地標,讓這些攝影師為圖片標記標籤。
而Google新宣布的兩項Kaggle挑戰,要邀請機器學習的愛好者和研究員參與,Landmark Recognition 2019的目標是要辨識出輸入圖片的地標,Landmark Retrieval 2019挑戰則是要找出所有包含該地標的圖片,這兩項挑戰總共祭出5萬美元的獎金,獲勝的隊伍將會受邀至CVPR 2019研討會發表使用方法。
此外,Google也開源釋出物體辨識的新技術Detect-to-Retrieve,Google利用物體偵測模型的邊界框(bounding boxes),給予含有目標類別物體的影像區域額外的權重,該方法大幅地提升了模型的準確率,Google釋出的模型是透過原本的Google-Landmarks資料集中,含有86,000張圖片的子資料集來訓練。
熱門新聞
2025-01-20
2025-01-20
2025-01-20
2025-01-20