Google採用新的註釋程序,產生乾淨無雜訊的表格到文字資料集ToTTo,並且提供可用來評估模型幻覺的方法
2021-01-20
| Mozilla | Common Voice | 資料集
Mozilla釋出最新長達7,226個小時的Common Voice語音資料集
最新的語音資料集共包含54種語言,550萬個語音剪輯,總語音長度達7,226個小時。
2020-07-06
少樣本分類是讓模型只以幾張圖像就能進行分類,而Meta-Dataset提供了一個用於評估少樣本分類模型效能的基準
2020-05-15
Google開放比8年前更大更完整的Borg叢集追蹤資料,供雲端技術研究用
由於機器與軟體經過8年發展,已經與過去有很多大的不同,因此Google再次釋出新的Borg叢集追蹤資料
2020-04-30
Google利用CC授權的音訊剪輯,結合使用自家開發的房間模擬器,創建了2萬多個訓練、驗證和評估用的錄音
2020-04-11
| AI | 史丹佛大學 | 機器人 | RoboTurk | 資料集 | Amazon | GAN | 英特爾 | 知識圖譜 | google | 二階梯度優化 | 臉書 | FastMRI
AI趨勢周報第122期:機器界ImageNet!史丹佛開源最大機器人操作影片資料集RoboTurk
史丹佛大學2年前展開RoboTurk專案,以群眾外包來收集操作機器手臂的示範影片,近日釋出RoboTurk資料集,要來推進機器人策略學習等;另一方面,Google發表超強深度學習二階梯度優化法,比前一代更省運算資源,同時也比所有一階優化器要快;英特爾用AI爬梳上百萬家企業網頁,透過知識圖譜從中找出有潛力的產業領頭羊,作為潛在客戶名單。
2020-03-05
| 社會科學 | 臉書 | 個資 | GDPR | 劍橋分析 | 資料集 | 社交媒體 | Social Science One
Social Science One及臉書終於釋出內含3,800萬個網址的資料集
此一資料集將讓社會科學家得以取得過去他們無法存取的資料,藉以研究社交媒體對民主與選舉的影響
2020-02-15
下雪路況不只讓車道難以辨識,雪也會使得光達與攝影機無法正常作用,自駕車模型需要從更完整的下雪行車資料集中學習
2020-02-05