Google擴充現有的YouTube-8M資料集,發布時間定位子資料集YouTube-8M Segments,YouTube-8M Segments擁有人工驗證過的標記,還加入了時間定位,標記出影片中實體出現的時間,如此讓YouTube-8M是分類資料集,同時也成為時間定位資料集。

YouTube-8M資料集是一個大型標籤影片資料集,由數百萬個YouTube影片組成,加入了由電腦自動產生的高品質標籤,涵蓋了高達3,800個視覺實體,這個資料集的特色是,其包括的數十億個影格以及聲音片段,可以儲存在單一個磁碟中,而這能用單個GPU,一天內就可以完成基準模型訓練,但由於資料集的規模以及多樣性內容,也可以讓使用者進行更深入複雜的影像與聲音模型。

Google提到,雖然之前的YouTube-8M資料集為影片分類應用,提供了有用的訓練資料,但是包含的只有機器產生的標籤,而且也缺乏精細的時間定位資料,這在某種程度限制了資料集的應用範圍。

而為了加速時間概念定位的研究,Google新發表了YouTube-8M Segments資料集,這是一個YouTube-8M的子資料集,內容為YouTube-8M中影片的5秒片段,由人工驗證實體出現在片段與否。Google並非詳盡地標記影片中的所有片段,而是另外創建YouTube-8M片段擴充,Google為每個隨選的YouTube-8M影片,平均標上5個標籤,YouTube-8M Segments資料集總共有237,000個片段,涵蓋一千種類別。

也就是說YouTube-8M Segments資料集的補充,使得YouTube-8M資料集現在除了是一個大規模分類資料集,也是一個時間定位資料集。

熱門新聞

Advertisement